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Vea The College Mathematics 
Journal 24 (1993), 41-46. 


Lo último que uno sabe cuando escribe un libro, 
es qué poner primero. 
—Blaise Pascal 
Pensées, 1670 


La tercera edición de Álgebra lineal: una introducción moderna conserva el enfoque y ca- 
racterísticas que los usuarios encontraron como fortalezas de la edición anterior. Sin em- 
bargo, agregué nuevo material para hacer el libro útil para una audiencia más amplia y 
también refresqué los ejercicios. 

Quiero que los alumnos vean al álgebra lineal como una materia excitante y que apre- 
cien su tremenda utilidad. Al mismo tiempo, quiero ayudarles a dominar los conceptos y 
técnicas básicas del álgebra lineal que necesitarán en otros cursos, tanto en matemáticas 
como en otras disciplinas. También quiero que los alumnos aprecien la interacción de las 
matemáticas teóricas, aplicadas y numéricas que impregna la materia. 

Este libro está diseñado para usarse en un curso introductorio de álgebra lineal en uno 
o dos semestres. Primero, y más importante, está dirigido a los alumnos, e hice mi mejor 
esfuerzo para escribir el libro de modo que ellos no sólo lo encuentren legible, sino tam- 
bién que quieran leerlo. Como en la primera y segunda ediciones, tomé en cuenta la reali- 
dad de que los alumnos que cursan álgebra lineal introductoria probablemente provengan 
de varias disciplinas. Además de las especialidades en matemáticas, es adecuado para los es- 
pecializados en ingeniería, física, química, ciencias de la computación, biología, ciencias 
ambientales, geografía, economía, psicología, negocios y educación, así como otros alum- 
nos que toman el curso como una materia optativa o para cumplir los requisitos del grado. 
En concordancia, el libro equilibra teoría y aplicaciones, está escrito en un estilo conversa- 
cional aunque es completamente riguroso, y combina una presentación tradicional con la 
preocupación por el aprendizaje centrado en el alumno. 

No existe como un mejor estilo de aprendizaje único. En cualquier grupo habrá algu- 
nos alumnos que trabajen bien de manera independiente y otros que trabajen mejor en 
grupos; algunos que prefieran el aprendizaje basado en conferencias y otros que prosperen 
en un escenario de talleres, realizando exploraciones; algunos que gocen con las manipula- 
ciones algebraicas, algunos que sean fanáticos del cálculo numérico (con y sin compu- 
tadora) y algunos que muestren fuerte intuición geométrica. En este libro continúo la pre- 
sentación del material en varias formas (algebraica, geométrica, numérica y verbal) de 
modo que todos los tipos de aprendices puedan encontrar una ruta a seguir. También traté 
de presentar los temas teórico, de cálculo y aplicación en una forma flexible, aunque inte- 
grada. Al hacerlo, espero que todos los alumnos estarán expuestos a los muchos lados del 
álgebra lineal. 

Este libro es compatible con las recomendaciones del Lineal Algebra Curriculum Study 
Group. Desde un punto de vista pedagógico, no hay duda de que, para la mayoría de los 
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alumnos, los ejemplos concretos deben anteceder a la abstracción. Aquí tomé este enfoque. 
También creo firmemente que el álgebra lineal trata esencialmente de vectores y que los 
alumnos deben ver primero vectores (en un escenario concreto) con la finalidad de obte- 
ner cierta comprensión geométrica. Más aún, la introducción temprana de los vectores 
permite a los alumnos ver cómo los sistemas de ecuaciones lineales surgen de manera na- 
tural de problemas geométricos. Luego las matrices surgen igualmente de manera natural 
como matrices de coeficientes de sistemas lineales y como agentes de cambio (transforma- 
ciones lineales). Esto prepara el escenario para los eigenvectores y las proyecciones ortogo- 
nales, los cuales se entienden mejor geométricamente. Los dardos que aparecen en la cu- 
bierta de este libro simbolizan vectores y reflejan mi convicción de que la comprensión 
geométrica debe anteceder a las técnicas de cálculo. 

Traté de limitar el número de teoremas en el texto. En su mayor parte, los resultados 
marcados como teoremas se usarán más tarde en el texto o resumen el trabajo prece- 
dente. Los resultados interesantes que no son el tema central del libro se incluyeron 
como ejercicios o exploraciones. Por ejemplo, el producto cruz de vectores se estudia 
sólo en exploraciones (en los capítulos 1 y 4). A diferencia de la mayoría de los libros de 
álgebra lineal, el que tiene en sus manos no tiene un capítulo acerca de determinantes. 
Los resultados esenciales están todos en la sección 4.2, con otro material interesante con- 
tenido en una exploración. Sin embargo, el libro es muy completo para ser un texto in- 
troductorio. Siempre que fue posible, incluí pruebas elementales y accesibles a los teore- 
mas, con la finalidad de evitar el tener que decir: “la prueba de este resultado está más 
allá del ámbito de este texto”. El resultado es, espero, una obra completa en sí misma. 

No fui tacaño con las aplicaciones: existen muchas más en el libro de las que se pue- 
den abarcar en un solo curso. Sin embargo, es importante que los alumnos vean la im- 
presionante gama de problemas a la que puede aplicarse el álgebra lineal. Incluí algún 
material moderno acera de teoría de codificación que por lo general no se encuentra en 
un texto introductorio de álgebra lineal. También hay impresionantes aplicaciones del 
álgebra lineal en el mundo real, y un tema de interés histórico, si no práctico, que se pre- 
senta como “viñetas” independientes. 

Espero que los profesores disfruten la enseñanza a partir de este libro. Más importante: 
espero que los alumnos que usen el libro terminen el curso apreciando la belleza, el poder 
y la tremenda utilidad del álgebra lineal y que tengan diversión a lo largo del camino. 


Qué hay de nuevo en la tercera edición 


La estructura global y el estilo de Álgebra lineal: una introducción moderna siguen siendo 
los mismos que en la tercera edición. 
He aquí un resumen del material nuevo: 


e Fl capítulo 1 se reorganizó de manera extensa. La introducción a la aritmética 
modular y al álgebra lineal finita se movieron a la sección 1.1. La sección 1.4 ahora sólo 
contiene aplicaciones: vectores código y una nueva subsección acerca de vectores fuerza, 
como aparecen en física e ingeniería. 

+ Los modelos económicos lineales, un tema de importancia en negocios y 
economía, se agregaron como aplicación en los capítulos 2 y 3. 

+ Una nueva viñeta acerca del “método de condensación” de Lewis Carroll para 
evaluar determinantes se agregó al capítulo 4. 

+ Hay más de 400 ejercicios nuevos o revisados. 

+  Realicé numerosos cambios pequeños de redacción para mejorar la claridad o 
precisión de la exposición. 

+ Las asignaciones de tareas en línea ahora pueden realizarse usando Enhanced 
WebAssign, que contiene ejercicios relacionados con el libro. 
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e Ejercicios, con soluciones, ahora están disponibles para los Apéndices en el sitio 
web para el libro a disposición del profesor. Esto facilitará el uso del libro para aquellos 
profesores que incluyan material de los apéndices en sus cursos. 

+ Todos los auxiliares existentes se actualizaron y muchos se colocaron en el sitio 
web de la empresa. 


Características 


El texto está escrito en un estilo simple, directo y conversacional. Tanto como fue posi- 
ble, usé “idioma matemático” en lugar de apoyarme de manera excesiva en notación ma- 
temática. Sin embargo, todas las pruebas dadas son totalmente rigurosas y el Apéndice A 
contiene una introducción a la notación matemática para quienes deseen simplificar su 
propia escritura. Ejemplos concretos casi siempre preceden a los teoremas, a los que 
luego siguen más ejemplos y aplicaciones. Este flujo, de lo específico a lo general y de re- 
greso, es consistente a lo largo del libro. 


Muchos alumnos encuentran dificultad en el álgebra lineal cuando el curso avanza de la 
realización de cálculos (resolver sistemas de ecuaciones lineales, manipulación de vecto- 
res y matrices) a lo teórico (espacios generadores, independencia lineal, subespacios, 
bases y dimensión). Este libro introduce todos los conceptos clave del álgebra lineal muy 
temprano, en un escenario concreto, antes de volver a visitarlos con total generalidad. 
Los conceptos vectoriales como producto punto, longitud, ortogonalidad y proyección 
se estudian primero en el capítulo 1, en el escenario concreto de R? y R? antes de que las 
nociones más generales de producto interior, norma y proyección ortogonal aparezcan 
en los capítulos 5 y 7. De igual modo, a los espacios generadores y la independencia li- 
neal se les da un tratamiento concreto en el capítulo 2, antes de su generalización a es- 
pacios vectoriales en el capítulo 6. Los conceptos fundamentales de subespacio, base y 
dimensión aparecen primero en el capítulo 3, cuando se introducen los espacios ren- 
glón, columna y nulo de una matriz; no es sino hasta el capítulo 6 cuando a estas ideas 
se les da un tratamiento general. En el capítulo 4 se introducen los eigenvalores y los ei- 
genvectores, y se exploran para matrices de 2 X 2 antes de que aparezcan sus contrapar- 
tes de n X n. Al comenzar el capítulo 4, todos los conceptos clave del álgebra lineal se han 
introducido, con ejemplos de cálculo concretos para apoyarlos. Cuando dichas ideas 
aparecen con plena generalidad más tarde en el libro, los alumnos han tenido tiempo de 
acostumbrarse a ellos y, por tanto, no se sienten intimidados. 


Énfasis en vectores y geometría 


Al conservar la filosofía de que el álgebra lineal trata principalmente con vectores, este 
libro subraya la intuición geométrica. En concordancia, el primer capítulo es acerca de 
vectores y desarrolla muchos conceptos que aparecerán de manera repetida a lo largo del 
texto. Conceptos como ortogonalidad, proyección y combinación lineal se encuentran 
todos en el capítulo 1, así como un tratamiento amplio de líneas y planos en R? que 
ofrece comprensión esencial a la solución de sistemas de ecuaciones lineales. Este énfasis 
en vectores, geometría y visualización se encuentra a lo largo del texto. Las transforma- 
ciones lineales se introducen como transformaciones de matrices en el capítulo 3, con 
muchos ejemplos geométricos, antes de incluir las transformaciones lineales generales 
en el capítulo 6. En el capítulo 4 se introducen los eigenvalores con “eigenimágenes” 
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como auxiliar visual. La prueba del Teorema de Perron se proporciona primero heurís- 
ticamente y luego formalmente, en ambos casos usando un argumento geométrico. La 
geometría de los sistemas dinámicos lineales refuerza y resume el material acerca de ei- 
genvalores y eigenvectores. En el capítulo 5, las proyecciones ortogonales, los comple- 
mentos ortogonales de subespacios y el proceso Gram-Schmidt se presentan todos en el 
escenario concreto de R? antes de generalizarse a R” y, en el capítulo 7, a espacios de pro- 
ducto interior. La naturaleza de la descomposición del valor singular también se explica 
de manera informal en el capítulo 7 vía un argumento geométrico. De las más de 300 fi- 
guras en el texto, más de 200 se dedican a fomentar una comprensión geométrica del ál- 
gebra lineal. 


La introducción a cada capítulo es una exploración guiada (sección 0) en la que se invita 
a los alumnos a descubrir, individualmente o en grupos, algún aspecto del capítulo veni- 
dero. Por ejemplo, “El juego de la pista de carreras” introduce los vectores, “Matrices en 
acción” introduce la multiplicación de matrices y las transformaciones lineales, “Fibo- 
nacci en el espacio (vectorial)” toca conceptos de espacio vectorial y “Geometría de taxi” 
establece normas generalizadas y funciones de distancia. Las exploraciones adicionales 
que se encuentran a lo largo del libro incluyen aplicaciones de vectores y determinantes 
a la geometría, una investigación de los cuadrados mágicos de 3 x 3, un estudio de la si- 
metría basado en los mosaicos de M. C. Escher, una introducción al álgebra lineal com- 
pleja y problemas de optimización usando desigualdades geométricas. También existen 
exploraciones que introducen importantes consideraciones numéricas y el análisis de al- 
goritmos. Hacer que los alumnos realicen algunas de estas exploraciones es una forma de 
alentarlos a convertirse en aprendices activos y de darles “dominio” sobre una pequeña 
parte del curso. 


El libro contiene una abundante selección de aplicaciones elegidas de una amplia gama 
de disciplinas, incluidas matemáticas, ciencias de la computación, física, química, inge- 
niería, biología, negocios, economía, psicología, geografía y sociología. Digno de aten- 
ción entre éstas es un fuerte tratamiento de la teoría de codificación, desde los códigos de 
detección de error (como el International Standard Book Numbers) hasta sofisticados 
códigos de corrección de error (como el código Reed-Muller, que se usó para transmitir 
fotografías satelitales desde el espacio). Adicionalmente, existen cinco “viñetas” que pre- 
sentan brevemente algunas aplicaciones muy modernas del álgebra lineal: el sistema Co- 
dabar, el sistema de posicionamiento global (GPS), robótica, motores de búsqueda en 
Internet y la compresión de imágenes digitales. 


Existen más de 400 ejemplos en este libro, la mayoría resueltos con mayor detalle de lo 
acostumbrado en un libro de texto introductorio al álgebra lineal. Este nivel de detalle es 
consecuente con la filosofía de que los alumnos querrán (y podrán) leer un libro de 
texto. En concordancia, no se tiene la intención de que todos los ejemplos se estudien en 
clase; muchos pueden asignarse para estudio individual o grupal, posiblemente como 
parte de un proyecto. La mayoría de los ejemplos tienen al menos un ejercicio contra- 
parte, de modo que los alumnos pueden practicar las habilidades incluidas en el ejemplo 
antes de explorar las generalizaciones. 

Hay más de 2000 ejercicios, más que en la mayoría de los libros de texto de nivel si- 
milar. La respuesta a la mayoría de los ejercicios de cálculo con número impar puede en- 
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contrarse en la parte final del libro. Los profesores descubrirán una riqueza de ejercicios 
de dónde elegir para asignaciones de tarea en casa. (En la Guía del Instructor en línea se 
brindan algunas sugerencias.) Los ejercicios en cada sección están graduados y avanzan 
de lo rutinario a lo desafiante. Los ejercicios varían desde los que tienen la intención del 
cálculo mental a los que requieren el uso de una calculadora o un sistema algebraico de 
cómputo, y de los ejercicios teóricos y numéricos a los ejercicios conceptuales. Muchos 
de los ejemplos y ejercicios usan datos reales recopilados de situaciones del mundo real. 
Por ejemplo, existen problemas acerca de modelado del crecimiento de poblaciones de 
caribúes y focas, datación con radiocarbono del monumento de Stonehenge y predic- 
ción de salarios de jugadores de las grandes ligas de beisbol. Trabajar tales problemas re- 
fuerza el hecho de que el álgebra lineal es una valiosa herramienta para el modelado de 
problemas de la vida real. 

Ejercicios adicionales aparecen en forma de repaso al final de cada capítulo. En cada 
conjunto hay 10 preguntas verdadero/falso diseñadas para poner a prueba la compren- 
sión conceptual, seguidas por 19 ejercicios de cálculo y teóricos que resumen los princi- 
pales conceptos y técnicas de cada capítulo. 


Es importante que los alumnos aprendan algo acerca de la historia de las matemáticas y 
lleguen a verla como un esfuerzo social y cultural, así como científico. En concordancia, 
el texto contiene breves bosquejos biográficos acerca de muchos de los matemáticos que 
contribuyeron al desarrollo del álgebra lineal. Espero que estos bosquejos ayuden a 
poner un rostro humano a la materia y que proporcionen a los alumnos otra forma de 
relacionarse con el material. La Guía del Instructor en línea sugiere formas para ampliar 
algunas de tales notas biográficas en proyectos de ensayo. 

Descubrí que muchos alumnos se sienten alejados de las matemáticas porque la ter- 
minología no tiene sentido para ellos: se trata simplemente de una colección de palabras 
por aprender. Para ayudar a superar este problema, incluí breves notas etimológicas que 
ofrecen los orígenes de muchos de los términos que se usan en álgebra lineal. (Por ejem- 
plo, ¿por qué se usa la palabra normal para referirse a un vector que es perpendicular a 
un plano?) 


Los márgenes del libro contienen muchos iconos cuyo propósito es alertar al lector en 
varias formas. El cálculo no es un prerrequisito para este libro, pero el álgebra lineal tiene 
muchas aplicaciones interesantes e importantes para el cálculo. El icono | denota un 
ejemplo o ejercicio que requiere cálculo. (Este material puede omitirse si nadie en el 
grupo ha cursado al menos un semestre de cálculo. Alternativamente, pueden asignarse 
como proyectos.) El icono denota un ejemplo o ejercicio que involucra números 
complejos. (Para los alumnos no familiarizados con los números complejos, el Apén- 
dice C contiene todo el material de antecedentes que se necesita.) El icono “Ê indica que 
se requiere, o al menos es muy útil, un sistema algebraico de cómputo (como Maple, 
Mathematica o MATLAB) o una calculadora con capacidades para matrices (como la 
TI-89, TI-Nspire, HP-48gl1, HP-50g, Casio 9850GC+ o Sharp EL-9200C) para resolver 
el ejemplo o ejercicio. 

Con la intención de ayudar a los alumnos a aprender cómo leer y usar este libro de 
texto de manera más efectiva, anoté varios lugares donde se aconseja al lector detenerse 
por un momento. Se trata de lugares donde se necesita un cálculo, debe suministrarse 
parte de una prueba, debe verificarse una afirmación o se requiere algo de pensamiento 
adicional. El icono => aparece en el margen de tales lugares; el mensaje es: “Detén- 
gase. Saque su lápiz. Piense en esto”, 
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Tecnología 


Este libro puede usarse exitosamente ya sea que los alumnos tengan o no acceso a la tec- 
nología. Sin embargo, las calculadoras con capacidades para matrices y los sistemas alge- 
braicos de cómputo son ahora comunes y, utilizados de manera adecuada, pueden enri- 
quecer la experiencia de aprendizaje así como ayudar con los cálculos tediosos. En este 
texto se toma el punto de vista de que los alumnos necesitan dominar todas las técnicas 
básicas del álgebra lineal al resolver ejemplos a mano que no son demasiado difíciles 
para realizar cálculos. Entonces la tecnología puede usarse (en todo o en parte) para re- 
solver ejemplos y aplicaciones posteriores, y para aplicar técnicas que se apoyen en los 
primeros. Por ejemplo, cuando se introducen por primera vez sistemas de ecuaciones li- 
neales, se proporcionan soluciones detalladas; más tarde, simplemente se presentan las 
soluciones, y se espera que el lector las compruebe. Este es un buen lugar para usar al- 
guna forma de tecnología. Del mismo modo, cuando las aplicaciones usen datos que 
hagan imprácticos los cálculos a mano, use tecnología. Todos los métodos numéricos 
que se estudian dependen del uso de tecnología. 

Con la ayuda de tecnología, los alumnos pueden explorar el álgebra lineal en ciertas 
formas excitantes y descubrir mucho por ellos mismos. Por ejemplo, si uno de los coefi- 
cientes de un sistema lineal se sustituye por un parámetro, ¿cuánta variabilidad hay en 
las soluciones? ¿Cómo cambiar una sola entrada de una matriz afecta sus eigenvalores? 
Este libro no es un curso acerca de tecnología, y en los lugares donde ésta puede usarse, 
no se especifica un tipo particular de tecnología. El sitio web para el alumno que acom- 
paña a este libro ofrece un apéndice en línea llamado Technology Bytes que ofrece ins- 
trucciones para resolver una selección de ejemplos de cada capítulo usando Maple, 
Mathematica y MATLAB. Al imitar dichos ejemplos, los alumnos pueden realizar más 
cálculos y exploraciones usando cualquier CAS (siglas en inglés de sistema algebraico de 
cómputo), MATLAB que tengan y explotar el poder de dichos sistemas para auxiliarse 
con los ejercicios a lo largo del libro, en particular con los marcados con el icono “$ . El 
sitio web también contiene conjuntos de datos y código de cómputo en formatos Maple, 
Mathematica y MATLAB relacionados con muchos ejercicios y ejemplos en el texto. 
Alumnos y profesores pueden importarlos directamente en su CAS para conservar la es- 
critura y eliminar errores. 


Álgebra lineal finita y numérica 


El texto abarca dos aspectos del álgebra lineal que escasamente se mencionan juntos: ál- 
gebra lineal finita y álgebra lineal numérica. Al introducir pronto aritmética modular, es 
posible hacer del álgebra lineal finita (más correctamente, “álgebra lineal sobre campos 
finitos”, aunque yo no uso dicha frase) un tema recurrente a lo largo del libro. Este enfo- 
que brinda acceso al material acerca de teoría de codificación en las secciones 1.4, 3.7, 
5.5, 6.7 y 7.5. También hay una aplicación a juegos lineales finitos en la sección 2.4 que 
los alumnos realmente gozarán. Además de estar expuestos a las aplicaciones de álgebra 
lineal finita, quienes se especialicen en matemáticas se beneficiarán de ver el material 
acerca de campos finitos, porque probablemente los encontrarán en cursos como mate- 
máticas discretas, álgebra abstracta y teoría de números. 

Todos los alumnos deben tener en cuenta que, en la práctica, en el álgebra lineal es 
imposible llegar a soluciones exactas de problemas de gran escala. La exposición a algu- 
nas de las técnicas del álgebra lineal numérica brindará un indicio de cómo obtener so- 
luciones aproximadas enormemente precisas. Algunos de los temas numéricos incluidos 
en el libro son: errores de redondeo y pivoteo parcial, métodos iterativos para resolver 
sistemas lineales y eigenvalores de computación, las factorizaciones LU y QR, las normas 
matriciales y números de condición, aproximación por mínimos cuadrados y el valor 
singular de descomposición. La inclusión del álgebra lineal numérica también plantea 
algunos problemas interesantes e importantes que están ausentes por completo de la teo- 
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ría del álgebra lineal, como las estrategias de pivoteo, la condición de un sistema lineal y 
la convergencia de los métodos iterativos. Este libro no sólo plantea dichas cuestiones, 
sino también muestra cómo puede abordarlos. Los discos de Gerschgorin, las normas 
matriciales y los valores singulares de una matriz, que se estudian en los capítulos 4 y 7, 
son útiles a este respecto. 


El Apéndice A contiene un panorama de la notación matemática y métodos de prueba, 
y el Apéndice B discute la inducción matemática. Todos los alumnos se beneficiarán de 
dichas secciones, pero quienes estén orientados a una especialidad en matemáticas acaso 
deban poner particular atención en ellos. Algunos de los ejemplos en dichos apéndices 
son raros (por ejemplo, el ejemplo B.6 del Apéndice B) y subrayan el poder de los méto- 
dos. El Apéndice C es una introducción a los números complejos. Para alumnos familia- 
rizados con dichos resultados, este apéndice puede servir como una útil referencia; para 
otros, esta sección contiene todo lo que necesitan conocer para aquellas partes del texto 
que usan números complejos. El Apéndice D es acerca de polinomios. Descubrí que mu- 
chos alumnos requieren repasar estos temas. La mayoría de los alumnos no está familia- 
rizado con la regla de los signos de Descartes; se usa en el capítulo 4 para explicar el com- 
portamiento de los eigenvalores de las matrices de Leslie. Los ejercicios que acompañan 
los cuatro apéndices pueden encontrarse en el sitio web del libro. 

Al final del libro se proporcionan respuestas cortas a la mayoría de los ejercicios de 
cálculo con número impar. Los conjuntos de ejercicios para acompañar los Apéndices A, 
B, C y D están disponibles en el sitio web acompañante, junto con sus respuestas de nú- 
mero impar. 


Los siguientes complementos están todos disponibles de manera gratuita para los profe- 
sores que adopten Álgebra lineal: una introducción moderna (tercera edición). Los alum- 
nos pueden comprar el Manual de Soluciones y Guía de Estudio del Alumno, por separado 
o adjunto con el libro. El sitio web tiene secciones protegidas con contraseña para alum- 
nos y profesores. 


Manual de Soluciones y Guía de Estudio del Alumno 

ISBN-10: 0-538-73771-9; 

ISBN-13: 978-0-538-73771-5 

Incluye soluciones detalladas de todos los ejercicios con número impar y de ejercicios se- 
leccionados con número par; resúmenes de sección y capítulo de símbolos, definiciones 
y teoremas; y consejos y sugerencias de estudio. Los ejercicios complejos se exploran me- 
diante un formato pregunta/respuesta diseñado para profundizar en el conocimiento. 
También se incluyen problemas desafiantes y de entretenimiento que exploran aún más 
ejercicios seleccionados. 


Solution Builder 

www.cengage.com/solutionbuilder 

Ofrece al profesor soluciones completas de todos los ejercicios del texto, incluidos los 
que se encuentran en las exploraciones y repasos de capítulo, en conveniente formato en 
línea. Solution Builder permite a los profesores crear impresiones personalizadas segu- 
ras de soluciones en PDF que coinciden exactamente con los ejercicios asignados al 
grupo. Disponible para quienes adopten el libro al firmar en la dirección web mencio- 
nada anteriormente. 
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Guía del Instructor 

www.cengage.com/math/poole, sitio web para el profesor 

Esta guía en línea, escrita por Douglas Shaw y Michael Prophet, aumenta el texto con va- 
liosos recursos pedagógicos como proyectos de trabajo grupal, consejos pedagógicos, in- 
teresantes preguntas de examen, ejemplos y material adicional para clases, y otros ítems 
diseñados para reducir el tiempo de preparación del profesor y hacer que las clases de ál- 
gebra lineal sean una experiencia atractiva e interactiva. Para cada sección del texto, la 
Guía del Instructor incluye tiempo y énfasis sugeridos, puntos a resaltar, preguntas para 
discusión, materiales y ejemplos de clase, consejos tecnológicos, proyectos estudiantiles, 
trabajo grupal con soluciones, ejemplos de tareas y sugerencias de preguntas para exa- 
men. 


ExamView* banco de exámenes electrónico 

ISBN-10: 0-538-73770-0; ISBN-13: 978-0-538-73770-8 

El software para exámenes ExamView permite a los profesores crear, entregar y persona- 
lizar rápidamente exámenes para sus grupos en formatos impresos y en línea, y caracte- 
rísticas de calificación automática. Incluye más de 500 preguntas verdadero/falso, opción 
múltiple y respuesta libre con base en el texto. Todos los ítems de examen también se 
proporcionan en formatos PDF y Microsoft® Word para los profesores que opten por no 
usar el componente de software. 


Enhanced WebAssign 

Un sistema de enseñanza/aprendizaje fácil de usar en línea que ofrece tareas para casa 
asignables, calificación automática, asistencia interactiva para estudiantes y control de 
gestión de curso para profesores. Con cientos de ejercicios acordes al texto, los alumnos 
obtienen práctica para resolver problemas que clarifican el álgebra lineal, construyen ha- 
bilidades e impulsan la comprensión conceptual. La interfase simple y amigable con el 
usuario de Enhanced WebAssign permite a los profesores crear rápidamente un curso, 
inscribir alumnos, seleccionar problemas para una tarea y controlar el número de inten- 
tos de respuesta que se permitan a los alumnos. Una boleta de calificaciones rica en ca- 
racterísticas ayuda a administrar las calificaciones del grupo, establecer curvas de califi- 
cación, asignar fechas límite y exportar resultados a una hoja de cálculo fuera de línea. 
Para más información, visite www.webassign.net/brookscole. 


Sitio web para Álgebra lineal: Una introducción moderna 
www.cengage.com/math/poole 

Contiene materiales adicionales en línea para acompañar el texto dirigidos a alumnos y 
profesores. Aquí pueden encontrarse ejercicios para acompañar los apéndices del libro, 
junto con respuestas seleccionadas. El apéndice Technology Bytes ofrece instrucciones 
CAS para Maple, Mathematica y MATLAB para resolver ejemplos de cada capítulo. Con- 
juntos de datos CAS descargables en formatos Maple, Mathematica y MATLAB ofrecen 
código directo de computadora para trabajar ejercicios y ejemplos del texto en un CAS. 
La Guía del Instructor, versiones estáticas de los ítems de examen ExamView y otros re- 
cursos útiles también son accesibles aquí sólo para los profesores. 


Los revisores de cada edición de este texto aportaron valiosos y con frecuencia perspica- 
ces comentarios acerca del libro. Estoy agradecido por el tiempo que cada uno de ellos 
tomó para hacer esto. Su juicio y útiles sugerencias contribuyeron enormemente al desa- 
rrollo y éxito de este libro, y quiero agradecerles personalmente: 

Mark Brittenham, University of Nebraska; Marek Elzanowski, Portland State Univer- 
sity; J. Douglas Faires, Youngstown State University; Yuval Flicker, The Ohio State Uni- 
versity; Justin Travis Gray, Simon Fraser University; William Hager, University of 
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Florida; Sasho Kalajdzievski, University of Manitoba; Israel Koltracht, University of 
Connecticut; Dr. En-Bing Lin, University of Toledo; Dr. Asamoah Nkwanta, Morgan 
State University; Gleb Novitchkov, Penn State University; Arthur Robinson, George 
Washington University; Roman Smirnov, Dalhousie University; Ron Solomon, Ohio 
State University; Mo Tavakoli, Chaffey College; Bruno Welfert, Arizona State Univer- 
sity. 

Estoy en deuda con mucha gente que, a lo largo de los años, influyó en mis percep- 
ciones acerca del álgebra lineal y la enseñanza de las matemáticas en general. Primero, 
quiero agradecer de manera colectiva a los participantes en las sesiones de educación y 
álgebra lineal especial en reuniones de la Mathematical Association of America y la Ca- 
nadian Mathematical Society. También aprendí mucho de la participación en la Cana- 
dian Mathematics Education Study Group y el Canadian Mathematics Education 
Forum. 

Quiero agradecer especialmente a Ed Barbeau, Bill Higginson, Richard Hoshino, 
John Grant McLoughlin, Eric Muller, Morris Orzech, Bill Ralph, Pat Rogers, Peter Taylor 
y Walter Whiteley, cuyos consejos e inspiración contribuyeron enormemente con la filo- 
sofía y el estilo de este libro. Mi gratitud también para Robert Rogers, quien desarrolló 
las soluciones para alumnos y profesores, así como el excelente contenido de la guía de 
estudio. Un agradecimiento especial para Jim Stewart por su apoyo y consejos conti- 
nuos. Joe Rotman y su adorable libro A First Course in Abstract Algebra inspiró las notas 
etimológicas en este libro, y me apoyé bastante en el The Words of Mathematics de Steven 
Schwartzman cuando compilé dichas notas. Agradezco a Art Benjamin por introdu- 
cirme en el sisetma Codabar. Mis colegas Marcus Pivato y Reem Yassawi ofrecieron in- 
formación útil acerca de los sistemas dinámicos. Como siempre, estoy agradecido con 
mis alumnos por plantear buenas preguntas y proporcionarme la realimentación nece- 
saria para convertirme en un mejor profesor. 

Sinceramente agradezco a todas las personas que estuvieron involucradas en la pro- 
ducción de este libro. Gunjan Chandola y su equipo en MPS Limited realizaron una sor- 
prendente labor al producir la tercera edición con un calendario muy apretado. Agra- 
dezco a Roger Lipsett por realizar una excelente labor al verificar la precisión de esta 
edición y a Richard Camp por hacer una concienzuda corrección del libro. Ha sido una 
experiencia deliciosa trabajar con los autores de los auxiliares, quienes estuvieron en la 
misma longitud de onda que yo desde el principio. Doug Shaw y Mike Prophet escribie- 
ron una excelente Guía del Instructor; Richard Pappas expandió y mejoró el contenido 
del banco de exámenes disponible en ExamView. Sobre todo, ha sido una delicia traba- 
jar con todos los equipos editoriales, de marketing y de producción en Cengage Lear- 
ning: Molly Taylor, editora sponsor; Dan Seibert, editor asociado; Shaylin Walsh, asis- 
tente editorial; Susan Miscio, gerente de proyecto de contenido; Andrew Coppola, editor 
de medios; y Jennifer Jones, gerente de marketing. Ellos ofrecieron atinados consejos 
acerca de cambios y adiciones, ofrecieron ayuda cuando la necesitaba, pero me permi- 
tieron escribir el libro que quería. Soy afortunado por haber trabajado con ellos, así 
como con el personal de las ediciones primera y segunda. 

Como siempre, agradezco a mi familia por su amor, apoyo y comprensión. Sin ellos, 
este libro no habría sido posible. 


David Poole 
dpooleCtrentu.ca 
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“Me dirías, por favor, 
hacia dónde debo ir desde aquí?” 
“Eso depende bastante 
de hacia dónde quieras ir”, dijo el Gato. 
—Lewis Carroll 
Alice's Adventures in 
Wonderland, 1865 


Este texto se escribió con flexibilidad en mente. Tiene la intención de usarse en un curso 
de uno o dos semestres con 36 clases por semestre. La gama de temas y aplicaciones lo 
hace adecuado para varias audiencias y tipos de cursos. Sin embargo, hay más material 
en el libro del que puede estudiarse en clase, incluso en un curso de dos semestres. Des- 
pués del siguiente panorama del texto hay algunas breves sugerencias acerca de formas 
de usar el libro. La Guía del Instructor en línea tiene sugerencias más detalladas, incluidas 
notas pedagógicas, ejercicios recomendados, actividades y proyectos para el salón de 
clase, y temas adicionales 


Panorama del texto 


Capítulo 1: Vectores 


El juego de la pista de carreras en la sección 1.0 sirve para introducir los vectores de ma- 
nera informal. (¡También es muy divertido para jugar!) Luego los vectores se introducen 
formalmente tanto desde un punto de vista algebraico como de uno geométrico. Las 
operaciones de suma y multiplicación escalar y sus propiedades se desarrollan primero 
en los escenarios concretos de R? y R? antes de generalizarse a R”. También se introdu- 
cen la aritmética modular y el álgebra lineal finita. La sección 1.2 define el producto 
punto de vectores y las nociones relacionadas de longitud, ángulo y ortogonalidad. El 
concepto muy importante de proyección (ortogonal) se desarrolla aquí; reaparecerá en 
los capítulos 5 y 7. La exploración “Vectores y geometría” muestra cómo pueden usarse 
métodos vectoriales para probar ciertos resultados en la geometría euclideana. La sec- 
ción 1.3 es una introducción básica, aunque amplia, a las líneas y los planos en R? y RÌ. 
Esta sección es crucial para comprender el significado geométrico de la solución de los 
sistemas lineales del capítulo 2. Note que el producto cruz de vectores en R? se deja como 
exploración. El capítulo concluye con dos aplicaciones: vectores fuerza y vectores código. 
La mayoría de los alumnos disfrutarán la aplicación al Universal Product Code (UPC) y 
al International Standard Book Number (ISBN). La viñeta acerca del sistema Codabar 
que se usa en tarjetas de crédito y bancarias es una excelente presentación para clase que 
incluso puede usarse para introducir la sección 1.4 
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Capítulo 2: Sistemas de ecuaciones lineales 


La introducción a este capítulo sirve para ilustrar que existe más de una forma de en- 
contrar una solución para un sistema de ecuaciones lineales. Las secciones 2.1 y 2.2 de- 
sarrollan la principal herramienta de evaluación para resolver sistemas lineales: reduc- 
ción de matrices (eliminación gaussiana y de Gauss-Jordan). Casi todos los métodos de 
evaluación posteriores en el libro dependen de esto. El teorema del rango aparece aquí 
por primera vez; se muestra de nuevo, con más generalidad, en los capítulos 3, 5, y 6. La 
sección 2.3 es muy importante: ahí se introducen las nociones fundamentales de genera- 
dores y de independencia lineal de vectores. No se apresure con este material. La sección 
2.4 contiene seis aplicaciones que pueden elegir los profesores, dependiendo del tiempo 
disponible y de los intereses del grupo. La viñeta acerca del Sistema de Posicionamiento 
Global ofrece otra aplicación que disfrutarán los alumnos. Los métodos iterativos de la 
sección 2.5 serán opcionales para muchos cursos, pero son esenciales para un curso con 
un enfoque aplicado/numérico. Las tres exploraciones de este capítulo se relacionan en 
que todos tratan con aspectos del uso de las computadoras para resolver sistemas linea- 
les. Todos los alumnos deben al menos estar al tanto de estos temas. 


Capítulo 3: Matrices 


Este capítulo contiene algunas de las ideas más importantes en el libro. Es un capítulo 
largo, pero el material inicial puede estudiarse muy rápidamente, con tiempo adicional 
reservado para el material crucial de la sección 3.5. La sección 3.0 es una exploración que 
introduce la noción de transformación lineal: la idea de que las matrices no sólo son ob- 
jetos estáticos sino más bien un tipo de función que transforma vectores en otros vecto- 
res. Todos los hechos básicos acerca de las matrices, las operaciones matriciales y sus pro- 
piedades se encuentran en las primeras dos secciones. El material acerca de matrices 
particionadas y las representaciones múltiples del producto matricial valen la pena des- 
tacarse, porque se usan repetidamente en secciones posteriores. El teorema fundamental 
de las matrices invertibles de la sección 3.3 es muy importante y aparecerá muchas veces 
más conforme se presenten nuevas caracterizaciones de invertibilidad. La sección 3.4 
discute la muy importante factorización LU de una matriz. Si este tema no se estudia en 
clase, vale la pena asignarlo como proyecto o discutirlo en un taller. El punto de la sec- 
ción 3.5 es presentar muchos de los conceptos clave del álgebra lineal (subespacio, base, 
dimensión y rango) en el escenario concreto de matrices antes de que los alumnos los 
vean con plena generalidad. Aunque los ejemplos de esta sección son todos familiares, es 
importante que los alumnos se acostumbren a la nueva terminología y, en particular, en- 
tiendan qué significa la noción de base. El tratamiento geométrico de las transformacio- 
nes lineales de la sección 3.6 tiene la intención de suavizar la transición hacia las trans- 
formaciones lineales generales del capítulo 6. El ejemplo de una proyección es 
particularmente importante porque reaparecerá en el capítulo 5. La viñeta acerca de bra- 
zos robóticos es una demostración concreta de la composición de transformaciones li- 
neales (y afines). Existen cinco aplicaciones de las cuales elegir en la sección 3.7. Deben 
estudiarse ya sean las cadenas de Markov o el modelo de Leslie de crecimiento poblacio- 
nal, de modo que puedan usarse nuevamente en el capítulo 4, donde se explicará su 
comportamiento. 


Capítulo 4: Eigenvalores y eigenvectores 


La introducción a la sección 4.0 presenta un interesante sistema dinámico que involucra 
gráficas. Esta exploración introduce la noción de un eigenvector y anuncia el método de 
potencias en la sección 4.5. Para conservar el énfasis geométrico del libro, la sección 4.1 
contiene la novedosa característica de “eigenimágenes” como una forma de visualizar los 
eigenvectores de matrices de 2 X 2. Los determinantes aparecen en la sección 4.2, moti- 
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vados por su uso en el descubrimiento de los polinomios característicos de matrices pe- 
queñas. Este “curso intensivo” de determinantes contiene todo el material esencial que 
necesitan los alumnos, incluida una prueba opcional pero elemental del teorema de ex- 
pansión de Laplace. La viñeta “Método de condensación de Lewis Carroll” presenta un 
método alternativo, con interés histórico, para calcular determinantes que los alumnos 
encontrarán muy atractivo. La exploración “Aplicaciones geométricas de los determi- 
nantes” constituye un buen proyecto que contiene muchos resultados interesantes y úti- 
les. (Alternativamente, los profesores que deseen poner más atención en los determi- 
nantes pueden elegir exponer parte de esta exploración en clase.) La teoría básica de los 
eigenvalores y los eigenvectores se encuentra en la sección 4.3, y la sección 4.4 trata el im- 
portante tema de la diagonalización. El ejemplo 4.29 acerca de potencias de matrices vale 
la pena estudiarlo en clase. El método de potencias y sus variantes, que se estudian en la 
sección 4.5, son opcionales, pero todos los alumnos deben estar al tanto del método, y un 
curso aplicado debe analizarlo con detalle. El teorema del disco de Gerschgorin puede 
estudiarse independientemente del resto de la sección 4.6. Aunque la prueba del Teo- 
rema de Perron es opcional, el teorema en sí (como el más fuerte teorema de Perron-Ero- 
benius) debe al menos mencionarse, porque explica por qué debemos esperar un eigen- 
valor positivo único con un correspondiente eigenvector positivo en dichas aplicaciones. 
Las aplicaciones acerca de relaciones de recurrencia y ecuaciones diferenciales conectan 
el álgebra lineal con las matemáticas discretas y el cálculo, respectivamente. La exponen- 
cial de matrices puede exponerse si su grupo tiene un buen antecedente de cálculo. El 
tema final de los sistemas dinámicos lineales discretos vuelve a revisar y resume muchas 
de las ideas del capítulo 4, y las observa bajo una nueva luz geométrica. Los alumnos go- 
zarán leyendo cómo pueden usarse los eigenvectores para ayudar a clasificar equipos de- 
portivos y sitios web. Esta viñeta puede ampliarse fácilmente a un proyecto o actividad 
enriquecedora. 


La exploración introductoria, “Sombras en la pared”, es la mejor matemática: toma un 
concepto conocido (proyección de un vector sobre otro vector) y lo generaliza en una 
forma útil (proyección de un vector sobre un subespacio: un plano), mientras descubre 
algunas propiedades anteriormente no observadas. La sección 5.1 contiene los resulta- 
dos básicos acerca de conjuntos de vectores ortogonales y ortonormales que se usarán 
repetidamente de aquí en adelante. En particular, deben destacarse las matrices ortogo- 
nales. En la sección 5.2 se generalizan dos conceptos del capítulo 1: el complemento or- 
togonal de un subespacio y la proyección ortogonal de un vector sobre un subespacio. El 
teorema de descomposición ortogonal es importanteaquí y ayuda a configurar el pro- 
ceso Gram-Schmidt. Note también la rápida prueba del teorema del rango. El proceso 
Gram-Schmidt se detalla en la sección 5.3, junto con la extremadamente importante fac- 
torización QR. Las dos exploraciones que siguen subrayan cómo se calcula en la práctica 
la factorización QR y cómo puede usarse para aproximar eigenvalores. La sección 5.4 
acerca de diagonalización ortogonal de matrices simétricas (reales) es necesaria para las 
aplicaciones que continúan. También contiene el teorema espectral, uno de los puntos 
destacados de la teoría del álgebra lineal. Las aplicaciones de la sección 5.5 incluyen có- 
digos duales, formas cuadráticas y graficación de ecuaciones cuadráticas. Yo siempre in- 
cluyo al menos la última de éstas en mi curso, porque amplía lo que ya conocen los alum- 
nos acerca de las secciones cónicas. 


La secuencia de Fibonacci reaparece en la sección 6.0, aunque no es importante que los 
alumnos la hayan visto antes (sección 4.6). El propósito de esta exploración es mostrar 
que los conceptos familiares de espacio vectorial (sección 3.5) pueden usarse fructífera- 
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mente en un nuevo escenario. Puesto que todas las ideas principales de los espacios vec- 
toriales ya se introdujeron en los capítulos 1-3, los alumnos encontrarán las secciones 6.1 
y 6.2 bastante familiares. El énfasis aquí debe ser sobre el uso de los axiomas de espacio 
vectorial para probar propiedades en lugar de apoyarse en técnicas para calcular. 
Cuando se discute el cambio de base en la sección 6.3, es útil mostrar a los alumnos 
cómo usar la notación para recordar cómo funciona la construcción. A final de cuentas, 
el método Gauss-Jordan es el más eficiente aquí. Son importantes las secciones 6.4 y 6.5 
acerca de transformaciones lineales. Los ejemplos se relacionan con resultados anterio- 
res acerca de matrices (y de transformaciones matriciales). En particular, es importante 
subrayar que el kernel y el rango de una transformación lineal generalizan el espacio 
nulo y el espacio de columna de una matriz. La sección 6.6 profundiza en la noción de 
que (casi) todas las transformaciones lineales son en esencia transformaciones matricia- 
les. Esto se apoya en la información de la sección 3.6, de modo que los alumnos no deben 
encontrarla terriblemente sorprendente. Sin embargo, los ejemplos deben resolverse 
cuidadosamente. La conexión entre cambio de base y similitud de matrices es digna de 
atención. La exploración “Mosaicos, retículas y la restricción cristalográfica” es una im- 
presionante aplicación del cambio de base. La conexión con la obra de M. C. Escher la 
hace todavía más interesante. Las aplicaciones de la sección 6.7 se apoyan en las anterio- 
res y pueden incluirse según lo permitan el tiempo y el interés. 


Capítulo 7: Distancia y aproximación 


La sección 7.0 abre con la entretenida exploración “Geometría de taxi”. Su propósito es 
establecer el material acerca de las funciones norma y distancia generalizadas (métricas) 
que se presentan después. Los espacios de producto interior se estudian en la sección 7.1; 
el énfasis aquí debe estar en los ejemplos y usar los axiomas. La exploración “Vectores y 
matrices con entradas complejas” muestra cómo pueden extenderse los conceptos de 
producto punto, matriz simétrica, matriz ortogonal y diagonalización ortogonal, desde 
los espacios vectoriales reales hasta los complejos. La siguiente exploración, “Desigual- 
dades geométricas y problemas de optimización”, es una que usualmente disfrutan los 
alumnos. (¡Se divertirán al ver cuántos problemas de “cálculo” pueden resolverse sin usar 
cálculo!) La sección 7.2 incluye normas vectoriales y matriciales generalizadas y muestra 
cómo el número condicional de una matriz se relaciona con la noción de sistemas linea- 
les mal condicionados que se exploró en el capítulo 2. La aproximación de mínimos cua- 
drados (sección 7.3) es una importante aplicación del álgebra lineal en muchas otras dis- 
ciplinas. El teorema de mejor aproximación y el teorema de mínimos cuadrados son 
importantes, pero sus pruebas son intuitivamente claras. Dedique algo de tiempo a los 
ejemplos, algunos serán suficientes. La sección 7.4 presenta la descomposición en valor 
singular, una de las aplicaciones más importantes del álgebra lineal. Si su curso llega 
hasta aquí, será ampliamente recompensado. La SVD no sólo vincula muchas nociones 
discutidas anteriormente; también ofrece algunas aplicaciones novedosas (y bastante 
poderosas). Si está disponible un CAS, la viñeta acerca de compresión de imagen digital 
vale la pena de presentar; es un impresionante despliegue visual del poder del álgebra li- 
neal y una culminación que ajusta bien con el curso. Las posteriores aplicaciones de la 
sección 7.5 pueden elegirse de acuerdo con el tiempo disponible y el interés del grupo. 


Los alumnos encontrarán el libro muy fácil de leer, por lo que yo generalmente les dejo 
leer una sección antes de exponer el material en clase. De esa forma puedo emplear el 
tiempo de clase destacando los conceptos más importantes y lidiar con los temas que a 
los alumnos les parecen difíciles, para trabajar ejemplos y para discutir aplicaciones. No 
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trato de abarcar todo el material de la lectura asignada en clase. Este enfoque me permite 
mantener el ritmo del curso bastante vivaz y freno un poco para aquellas secciones que 
usualmente a los alumnos les resultan desafiantes. 

En un curso de dos semestres es posible revisar todo el libro, incluida una razonable 
selección de aplicaciones. Para flexibilidad adicional, puede omitir algunos de los temas 
(por ejemplo, ofrecer sólo un breve tratamiento del álgebra lineal numérica), de ese 
modo libero tiempo para un análisis más a profundidad de los temas restantes, más apli- 
caciones o alguna de las exploraciones. En un curso de matemáticas decente que enfatice 
las pruebas, gran parte del material en los capítulos 1-3 puede estudiarse rápidamente. 
Entonces el capítulo 6 puede exponerse en conjunción con las secciones 3.5 y 3.6, y el ca- 
pítulo 7 puede integrarse en el capítulo 5. Yo me aseguraría de asignar las exploraciones 
de los capítulos 1, 4, 6 y 7 para tales clases. 

Para un curso de un semestre, la naturaleza del curso y la audiencia determinarán 
cuáles temas incluir. A continuación se describen tres posibles cursos. El curso básico, 
descrito primero, tiene menos de 36 horas sugeridas, lo que permite tiempo para temas 
adicionales, revisión en clase y exámenes. Los otros dos cursos se apoyan en el curso bá- 
sico, pero todavía son bastante flexibles. 


A continuación se bosqueja un curso diseñado para especialidades en matemáticas y 
alumnos de otras disciplinas. Este curso no menciona espacios vectoriales generales en 
absoluto (todos los conceptos se tratan en un escenario concreto) y es muy ligero en las 
pruebas. Sin embargo, es una introducción completa al álgebra lineal. 


Sección Número de clases Sección Número de clases 
1.1 1 3.6 1-2 
1.2 1-1.5 4.1 1 

1.3 1-1.5 4.2 2 

2.1 0.5-1 4.3 1 

232 1-2 4.4 1-2 
2.3 1-2 5.1 1-1.5 
3.1 1-2 2 1-1.5 
3.2 1 5.3 0.5 
3.3 2 5.4 1 

3.5 2 7.3 2 


Total: 23-30 clases 


Dado que los alumnos en un curso como este representan una amplia variedad de 
disciplinas, yo sugeriría el uso de gran parte del tiempo de clase restante para aplicacio- 
nes. En mi curso lo hago con los vectores de código de la sección 1.4, lo que realmente 
parece agradar a los alumnos, y al menos una aplicación de cada uno de los capítulos 
2-5. Otras aplicaciones pueden asignarse como proyectos, junto con tantas de las explo- 
raciones como se desee. También existe suficiente tiempo de clase disponible para estu- 
diar parte de la teoría con detalle. 
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Para un curso con énfasis en la realización de cálculos, el curso básico que se presentó en 
la página anterior puede complementarse con las secciones del texto que tratan con el ál- 
gebra lineal numérica. En tal caso, yo expondría en parte o completas las secciones 2.5, 
3.4, 4.5, 5.3, 7.2 y 7.4, para terminar con la descomposición en valores singulares. Las ex- 
ploraciones de los capítulos 2 y 5 son particularmente adecuadas para tal curso, como lo 
son casi cualquiera de las aplicaciones. 


Algunos cursos estarán dirigidos a alumnos que ya encontraron los principios básicos 
del álgebra lineal en otros cursos. Por ejemplo, un curso de álgebra universitaria con fre- 
cuencia incluirá una introducción a los sistemas de ecuaciones lineales, matrices y deter- 
minantes; un curso de cálculo en muchas variables casi seguramente contendrá material 
acerca de vectores, líneas y planos. Para los alumnos que ya han visto tales temas, puede 
omitirse gran parte del material inicial y sustituirlo con un repaso rápido. Dependiendo 
de los antecedentes del grupo, puede ser posible revisar rápidamente el material en el 
curso básico hasta la sección 3.3 aproximadamente en seis clases. Si el grupo tiene un nú- 
mero significativo de especialistas en matemáticas (y especialmente si este es el único 
curso de álgebra lineal que tendrán), yo me aseguraría de exponer las secciones 1.4, 6.1- 
6.5, 7.1 y 7.4 y tantas aplicaciones como permita el tiempo. Si el curso tiene especialistas 
en ciencia (mas no especialistas en matemáticas), abarcaría las secciones 1.4, 6.1 y 7.1 y 
una selección más amplia de aplicaciones, para estar seguro de incluir el material acerca 
de ecuaciones diferenciales y aproximación de funciones. Si están más representados los 
alumnos de ciencias de la computación o ingenieros, trataría de exponer tanto material 
como pudiera acerca de códigos y álgebra lineal numérica. 

Existen muchos otros tipos de cursos que pueden usar con éxito este libro. Espero 
que usted lo encuentre útil para su curso y que se divierta al usarlo. 


“Por dónde debo comenzar, por favor, su majestad?” 
preguntó. 
“Comience por el principio”, dijo el rey, con gravedad, 
“y continúe hasta que llegue al final: entonces 
deténgase.” 
—Lewis Carroll 
Alice's Adventures in 
Wonderland, 1865 


El álgebra lineal es una materia excitante. Está llena de resultados interesantes, aplicacio- 
nes para otras disciplinas y conexiones hacia otras áreas de las matemáticas. El Manual 
de soluciones y guía de estudio del estudiante contiene consejos detallados acerca de cómo 
usar mejor este libro; a continuación se ofrecen algunas sugerencias generales. 

El álgebra lineal tiene varios lados: existen técnicas para realizar cálculos, conceptos y 
aplicaciones. Una de las metas de este libro es ayudarlo a dominar todas estas facetas de 
la materia y a ver la interacción entre ellas. En consecuencia, es importante que lea y 
comprenda cada sección del texto antes de abordar los ejercicios en dicha sección. Si sólo 
lee los ejemplos que se relacionan con los ejercicios que se asignaron como tarea para 
casa, perderá mucho. Asegúrese de entender las definiciones de términos y el significado 
de los teoremas. No se preocupe si tiene que leer algo más de una vez antes de compren- 
derlo. Tenga a mano lápiz y calculadora mientras lee. Deténgase para trabajar los ejem- 
plos por usted mismo o para completar los cálculos faltantes. El icono > en el mar- 
gen indica un lugar donde debe detenerse y pensar en lo que ha leído hasta el momento. 

Las respuestas a la mayoría de los ejercicios con número impar para realizar cálculos 
están al final del libro. Resista a la tentación de mirar la respuesta antes de haber com- 
pletado una pregunta. Y recuerde que, incluso si su respuesta difiere de la del libro, toda- 
vía puede estar correcto; hay más de una forma correcta de expresar algunas de las solu- 
ciones. Por ejemplo, un valor de 1/V2 también puede expresarse como V2/2, y el 


conjunto de todos los múltiplos escalares del vector | | es el mismo que el conjunto 


3 
1/2 
de todos los múltiplos escalares de | i! 


Conforme encuentre nuevos conceptos, trate de relacionarlos con los ejemplos que 
conozca. Escriba las pruebas y soluciones a los ejercicios en una forma lógica y conec- 
tada, y use oraciones completas. Lea de nuevo lo que escribió para ver si tiene sentido. 
Mejor aún: si puede, haga que un amigo del grupo lea lo que usted escribió. Si no tiene 
sentido para otra persona, hay posibilidades de que no tenga sentido, punto. 

Descubrirá que son útiles o una calculadora con capacidades para matrices o un sis- 
tema algebraico de cómputo. Dichas herramientas pueden ayudarle a verificar sus pro- 
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pios cálculos a mano y son indispensables para algunos problemas que involucran 
cálculos tediosos. La tecnología también le permite explorar aspectos del álgebra lineal 
por cuenta propia. Puede jugar juegos de “¿y si...?”: ¿y si cambio uno de los elementos 
en este vector? ¿Y si esta matriz es de un tamaño diferente? ¿Puedo forzar la solución 
para que sea lo que quiero que sea al cambiar algo? Para señalar los lugares en el texto o 
los ejercicios donde se recomienda el uso de tecnología, coloqué el icono “Ê en el mar- 
gen. El sitio web que acompaña a esta obra contiene ejercicios seleccionados del libro, re- 
sueltos con código de computadora usando Maple, Mathematica y MATLAB, así como 
Technology Bytes, un apéndice que proporciona múltiples consejos adicionales acerca del 
uso de la tecnología en el álgebra lineal. 

Está a punto de embarcarse en un viaje a través del álgebra lineal. Piense en este libro 
como en su guía de viaje. ¿Está listo? ¡Adelante! 


Aquí vienen, surgiendo de la 
tristeza. Pequeñas flechas para mí 
y para ti. 
— Albert Hammond y 
Mike Hazelwood 
Little Arrows 
Dutchess Music/BMI, 1968 


1.0 Introducción: el juego de la pista 
de carreras 


Muchas cantidades mensurables, como la longitud, el área, el volumen, la masa y la tem- 
peratura, pueden describirse completamente al especificar su magnitud. Otras cantida- 
des, como la velocidad, la fuerza y la aceleración, requieren tanto una magnitud como 
una dirección para su descripción. Estas cantidades son vectores. Por ejemplo, la veloci- 
dad del viento es un vector que consta de rapidez del viento y su dirección, como 10 
km/h suroeste. Geométricamente, los vectores se representan con frecuencia como fle- 
chas o segmentos de recta dirigidos. 

Aunque la idea de vector se introdujo en el siglo XIX, su utilidad práctica, particu- 
larmente en las ciencias físicas, no se conoció sino hasta el siglo XX. Más recientemente, 
los vectores encontraron aplicaciones en ciencias de la computación, estadística, econo- 
mía y las ciencias de la vida y sociales. A lo largo de este libro se considerarán algunas de 
estas muchas aplicaciones. 

Este capítulo introduce los vectores y comienza por considerar algunas de sus pro- 
piedades geométricas y algebraicas. También se considerarán aplicaciones no geométri- 
cas en las que son útiles los vectores. Sin embargo, se comienza con un juego simple que 
presenta algunas de las ideas clave. [Incluso quizá quiera jugarlo con un amigo durante 
los momentos aburridos (¡muy raros!) en las clases de álgebra lineal. ] 

El juego se juega en papel gráfico. Sobre éste se dibuja una pista, con una línea de 
partida y una línea de meta. La pista puede ser de cualquier longitud y forma, en tanto 
sea suficientemente ancha para alojar a todos los jugadores. Para este ejemplo, se tendrán 
dos jugadores (llámelos Ann y Bert), que usan plumas de diferentes colores para repre- 
sentar sus carros O bicicletas o cualquier cosa que empleen para correr alrededor de la 
pista. (Piense en Ann y Bert como ciclistas.) 

Ann y Bert comienzan cada uno por dibujar un punto en la línea de partida en un 
lugar de la cuadrícula sobre el papel gráfico. Toman turnos para moverse hacia un nuevo 
punto de la cuadrícula, sujetos a las siguientes reglas: 


1. Cada nuevo punto en la cuadrícula y el segmento de recta que lo conecta con el 
punto anterior en la cuadrícula debe encontrarse completamente dentro de la pista. 

2. Dos jugadores no pueden ocupar el mismo punto en la cuadrícula en el mismo 
turno. (Esta es la regla de “no colisión”) 

3. Cada nuevo movimiento se relaciona con el movimiento anterior del modo si- 
guiente: si un jugador se mueve a unidades horizontalmente y b unidades vertical- 
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El matemático irlandés William 
Rowan Hamilton (1805-1865) usó 
conceptos vectoriales en su estudio 
de los números complejos y su 
generalización, los cuaterniones. 


mente en un movimiento, entonces en el siguiente movimiento debe moverse entre 
a—1ya+ 1 unidades horizontalmente, y entre b— 1 y b + 1 unidades verticalmente. 
En otras palabras, si el segundo movimiento es c unidades horizontalmente y d uni- 
dades verticalmente, entonces la — c| = 1 y lb — d| < 1. (Esta es la regla “acelera- 
ción/desaceleración”.) Note que esta regla fuerza al primer movimiento a ser 1 uni- 
dad verticalmente y/o 1 unidad horizontalmente. 


Un jugador que choque con otro o deje la pista, es eliminado. El ganador es el primer 
jugador en cruzar la línea de meta. Si más de un jugador cruza la línea de meta en el 
mismo turno, quien las sobrepase más es el ganador. 

En el juego de muestra que se presenta en la figura 1.1, Ann fue la ganadora. Bert ace- 
leró muy rápidamente y tuvo dificultades para tomar la curva en la parte superior de la 
pista. 

Para comprender la regla 3, considere el tercer y cuarto movimientos de Ann. En su 
tercer movimiento, avanzó 1 unidad horizontalmente y 3 unidades verticalmente. En 
su cuarto movimiento, sus Opciones eran moverse de O a 2 unidades horizontalmente y 
de 2 a 4 unidades verticalmente. (Note que algunas de dichas combinaciones la habrían 
dejado fuera de la pista.) Eligió moverse 2 unidades en cada dirección. 


Inicio Meta 
A 


Figura 1.1 


Un ejemplo del juego de pista de carrera 


Problema 1 Juegue algunos juegos de la pista de carreras. 

Problema 2 ¿Es posible que Bert gane esta carrera si elige una secuencia diferente de 
movimientos? 

Problema 3 Use la notación [a, b] para denotar un movimiento que sea a unidades 
horizontalmente y b unidades verticalmente. (Tanto a o b o ambos pueden ser negati- 
vos.) Si acaba de realizar el movimiento (3, 4], dibuje en el papel gráfico todos los pun- 
tos de la cuadrícula que posiblemente podría alcanzar en el siguiente movimiento. 

Problema 4 ¿Cuál es el efecto neto de dos movimientos sucesivos? En otras palabras, 
si se mueve la, b] y luego [c, d], ¿cuán lejos, horizontal y verticalmente, se habrá movido? 


El plano cartesiano recibe su nom- 
bre en honor del filósofo y mate- 
mático francés René Descartes 
(1596-1650), cuya introducción de 
las coordenadas permitió que los 
problemas geométricos se maneja- 
ran con el uso de técnicas algebrai- 
cas. 


La palabra vector proviene de la 
raíz latina que significa “transpor- 
tar”. Un vector se forma cuando un 
punto se desplaza, o “transporta”, 
una distancia dada en una direc- 
ción dada. Visto de otra forma, los 
vectores “transportan” dos piezas 
de información: su longitud y su 
dirección. 

Cuando los vectores se escriben 
a mano, es difícil indicar las negri- 
tas. Algunas personas prefieren es- 
cribir Y para el vector denotado en 
impreso por v, pero en la mayoría 
de los casos está bien usar una mi- 
núscula ordinaria v. Por lo general 
será claro desde el contexto 
cuando la letra denota un vector. 


La palabra componente se deriva de 
las palabras latinas co, que significa 
“junto con”, y ponere, que significa 
“poner”. Por tanto, un vector es 
“poner juntos” sus componentes. 
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Problema 5 Escriba la secuencia de movimientos de Ann con la notación [a, b]. Su- 
ponga que ella comienza en el origen (0, 0) en los ejes coordenados. Explique cómo 
puede encontrar las coordenadas del punto de cuadrícula correspondiente a cada uno 
de sus movimientos sin mirar el papel gráfico. Si los ejes se dibujan de manera dife- 
rente, de modo que el punto de partida de Ann no esté en el origen sino en el punto (2, 
3), ¿cuáles serían las coordenadas de su punto final? 


Aunque simple, este juego introduce muchas ideas que serán útiles en el estudio de los 
vectores. Las siguientes tres secciones consideran a los vectores desde los puntos de vista 
geométrico y algebraico, comenzando, como en el juego de la pista de carreras, en el 
plano. 


Geometría y álgebra de vectores 


Comience por considerar el plano cartesiano con los familiares ejes x y y. Un vector es un 
segmento de recta dirigido que corresponde a un desplazamiento desde un punto A hasta 
otro punto B; vea la figura 1.2. n 

Fl vector de A a B se denota mediante AB; el punto A se conoce como su punto ini- 
cial u origen, y el punto B se conoce como su punto terminal o punta. Con frecuencia, 
un vector simplemente se denota mediante una sola letra minúscula negrita, como v. 

El conjunto de todos los puntos en el plano corresponden al conjunto de todos los 
vectores cuyos orígenes están en el origen O. A cada punto A, le corresponde el vector 
a= OA; a cada vector a con origen en O, le corresponde su punta A. (Los vectores de esta 
forma en ocasiones se conocen como vectores de posición.) 

Es natural representar dichos vectores usando coordenadas. Por ejemplo, en la figura 
1.3, A = (3, 2) y el vector se escribe a = OA = [3, 2] con corchetes. De igual modo, los 
otros vectores en la figura 1.3 son 


b=[-13] y c=[2,-1] 


Las coordenadas individuales (3 y 2 en el caso de a) se llaman los componentes del vec- 
tor. En ocasiones, se dice que un vector es un par ordenado de números reales. El orden 
es importante pues, por ejemplo, [3,2] # [2, 3]. En general, dos vectores son iguales si y 
sólo si sus componentes correspondientes son iguales. Por tanto, [x, y] = [1, 5] implica 
quex=1yy=5. 

Con frecuencia es conveniente usar vectores columna en lugar de (o además de) vec- 


tores renglón. Otra representación de [3, 2] es . (El punto importante es que los 


Figura 1.2 Figura 1.3 
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componentes están ordenados.) En capítulos posteriores verá que los vectores columna 
son un tanto mejores desde el punto de vista computacional; por ahora, trate de acos- 
tumbrarse a ambas representaciones. e 

Puede ocurrir que en realidad no pueda dibujar el vector [0, 0] = OO desde el ori- 
gen hacia sí mismo. No obstante. Es un vector perfectamente bueno y tiene un nombre 
especial: el vector cero. El vector cero se denota 0. 

El conjunto de todos los vectores con dos componentes se denota R? (donde R de- 

R? se pronuncia “r dos” nota el conjunto de números reales de donde se eligen los componentes de los vectores 
en R?). Por tanto, [—1, 3.5], [W2, 71] y [}, 4] están todos en R°. 

Piense de nuevo en el juego de la pista de carreras y trate de conectar todas estas ideas 
con los vectores cuyos orígenes no están en el origen. El origen etimológico de la palabra 
vector en el verbo “transportar” ofrece una pista. El vector [3, 2] puede interpretarse del 
modo siguiente: a partir del origen O, viaje 3 unidades a la derecha, luego 2 unidades 
arriba y termine en P. El mismo desplazamiento puede aplicarse con otros puntos inicia- 
les. La figura 1.4 muestra dos desplazamientos equivalentes, representados por los vecto- 

—>+ “> 
res AB y CD. 


Figura 1.4 


Dos vectores se definen como iguales si tienen la misma longitud y la misma direc- 
ción. Por tanto, AB = CD en la figura 1.4. (Aun cuando tengan diferentes puntos inicial 
y final, representan el mismo desplazamiento.) Geométricamente, dos vectores son igua- 


Cuando se hace referencia a los les si uno puede obtenerse al deslizar (o trasladar) el otro paralelo a sí mismo hasta que 
vectores mediante coordenadas, se los dos vectores coincidan. En términos de componentes, en la figura 1.4 se tiene A = 
les considera analíticamente. (3, 1) y B = (6, 3). Note que el vector [3, 2] que registra el desplazamiento sólo es la di- 


ferencia de los componentes respectivos: 


AB = [3,2] = [6 — 3,3 — 1] 


De igual modo, CD = [-1 — (—4), 1 — (—1)] = [3,2] 


— —> 
y por tanto AB = CD, como se esperaba. 

à Ta Brian . + koia 

Se dice que un vector como OP con su punto inicial en el origen está en posición es- 

tándar. La discusión anterior muestra que todo vector puede dibujarse como un vector 

en posición estándar. Por otro lado, un vector en posición estándar puede redibujarse 

| (por traslación) de modo que su origen esté en cualquier punto en el plano. 


> 
Ejemplo 1.1 Si A = (—1,2) y B = (3, 4), encuentre AB y vuelva a dibujarlo (a) en posición estándar 
y (b) con su origen en el punto C = (2, —1). 


Solución Calcule AB = [3 — (1), 4 — 2] = [4, 2]. Si entonces AB se traslada hacia 
CD, donde C = (2, —1), entonces se debe tener D = (2 + 4, —1 + 2) = (6, 1). (Vea la 
figura 1.5.) 
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+ B(3,4) 
aei at 
T [42] 


Figura 1.5 


el 


Como en el juego de la pista de carreras, con frecuencia se quiere “seguir” un vector a 
partir de otro. Esto conduce a la noción de suma de vectores, la primera operación vec- 
torial básica. 

Si se sigue u por v, se puede visualizar el desplazamiento total como un tercer vector, 
denotado mediante u + v. En la figura 1.6, u = [1,2] y v = [2, 2], de modo que el efecto 
neto de seguir u por v es 


[1 +2,2 +2] = [3,4] 


lo que produce u + v. En general, si u = [u u] y v = [v,, v2], entonces su suma u + v es 
el vector 


uty |A vi +n] 


Es útil visualizar u + v geométricamente. La siguiente regla es la versión geométrica de 
la discusión anterior. 


Figura 1.6 
Suma de vectores 
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La regla punta a origen 


Dados los vectores u y v en [R?, traslade v de modo que su origen coincida con la 
punta de u. La suma u + v de u y v es el vector desde el origen de u hasta la punta 
de v. (Vea la figura 1.7.) 


v 
SA 
a v 
u 
v Figura 1.7 
La regla punta a origen f 
u v 
Al trasladar u y v paralelos a ellos mismos, se obtiene un paralelogramo, como se mues- 
Figura 1.8 tra en la figura 1.8. Este paralelogramo se llama paralelogramo determinado por u y v. Ello 
El paralelogramo conduce a una versión equivalente de la regla punta a origen para vectores en posición 
determinado por u y v estándar. 


> 


La regla del 
paralelogramo 


Dados los vectores u y v en R? (en posición estándar), su suma u + v es el vector en 
posición estándar a lo largo de la diagonal del paralelogramo determinado por u y v. 
(Vea la figura 1.9.) 


Figura 1.9 
La regla del paralelogramo 


Ejemplo 1.2 | si. = (3, —1] yv = [1, 4], calcule y dibuje u + v. 
Solución Calcule u + v = [3 + 1, —1 + 4] = [4, 3]. Este vector se dibuja mediante 


la regla punta a origen en la figura 1.10(a) y mediante la regla del paralelogramo en la 
figura 1.10(b). 
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+ u+v 


(a) (b) 
Figura 1.10 


La segunda operación vectorial básica es la multiplicación escalar. Dado un vector v 
y un número real c, el múltiplo escalar cv es el vector que se obtiene al multiplicar cada 
componente de v por c. Por ejemplo, 3[—2, 4] = [-6, 12]. En general, 


cv = c [vp v] = [cv,, cv] 


Geométricamente, cv es una versión “a escala” de v. 


Ejemplo 1.3 Si v = [—2, 4], calcule y dibuje 2v, įv, y — 2v. 


Solución Calcule del modo siguiente: 


Estos vectores se muestran en la figura 1.11. 


2v 


+ —2v 


Figura 1.11 
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2v 


Figura 1.12 


El término escalar proviene de la 
palabra latina scala, que significa 
“escalera”. Los peldaños igual- 
mente espaciados en una escalera 
sugieren una escala y, en aritmética 
vectorial, la multiplicación por 
una constante sólo cambia la es- 
cala (o longitud) de un vector. Por 
ende, las constantes llegaron a co- 
nocerse como escalares. 


—2v 


u + (—v) u 
ne, ly = 
2 Figura 1.13 
Resta de vectores 


Observe que cv tiene la misma dirección que v si c > 0 y la dirección opuesta si c < 
0. También observe que cv es lel veces más largo que v. Por esta razón, en el contexto de 
los vectores, las constantes (esto es: números reales) se conocen como escalares. Como 
muestra la figura 1.12, cuando se toma en cuenta la traslación de vectores, dos vectores 
son múltiplos escalares mutuos si y sólo si son paralelos. 

Un caso especial de un múltiplo escalar es (—1)v, que se escribe —v y se llama nega- 
tivo de v. Puede usársele para definir la resta vectorial: la diferencia de u y v es el vector 
u — v definido por 


u—v=u+ (—v) 


La figura 1.13 muestra que u — v corresponde a la “otra” diagonal del paralelogramo de- 
terminado por u y v. 


Ejemplo 1.4 


Figura 1.14 


Siu = [1,2] yv = [-3, 1], entonces u — v = [1 — (-3),2 — 1] = [4, 1]. 


La definición de resta en el ejemplo 1.4 también está de acuerdo con la forma en que 
se calcula un vector como AB. Si los puntos A y B corresponden a los vectores a y b en 
posición estándar, entonces AB = b — a, como se muestra en la figura 1.14. [Observe 
que la regla de punta a origen aplicada a este diagrama produce la ecuación a + (b — 
a) = b. Si accidentalmente dibujara b — a con su punta en A en lugar de en B, el dia- 
grama se leería b + (b — a) = a, ¡que claramente está equivocado! Más adelante, en esta 
sección, se hablará más acerca de las expresiones algebraicas que involucran vectores.] 


Vectores en R° 


Todo lo que se ha hecho se extiende con facilidad a tres dimensiones. El conjunto de 
todas las ternes ordenadas de números reales se denota mediante R°. Puntos y vectores se 
localizan usando tres ejes coordenados mutuamente perpendiculares que se reúnen en el 
origen O. Un punto como A = (1, 2, 3) puede localizarse del modo siguiente: primero 
recorra 1 unidad a lo largo del eje x, luego avance 2 unidades paralelas al eje y y final- 
mente mueva 3 unidades paralelas al eje z. El vector correspondiente a = [1, 2, 3] es en- 
tonces OA, como se muestra en la figura 1.15. 

Otra forma de visualizar el vector a en R? es construir una caja cuyos seis lados estén 
determinados por los tres planos coordenados (los planos xy, xz y yz) y por tres planos a 
través del punto (1, 2, 3) paralelos a los planos coordenados. El vector [1, 2, 3] corres- 
ponde entonces a la diagonal que va del origen a la esquina opuesta de la caja (vea la fi- 
gura 1.16). 


Figura 1.17 


u+v=v+u 
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y A(1, 2,3) ME 


Xx 


Figura 1.15 Figura 1.16 


Las definiciones “en componentes” de la suma de vectores y la multiplicación escalar 
se extienden a R? en una forma obvia. 


Vectores en R” 


En general, R” se define como el conjunto de todas las n-adas ordenadas de números 
reales escritos como vectores renglón o columna. Por ende, un vector v en R” es de la 
forma 


[Y V... Va] O 


Las entradas individuales de v son sus componentes; v; se llama el componente ¡-ésimo. 

Las definiciones de suma vectorial y multiplicación escalar se extienden a R” en la 
forma obvia: si u = [u,,u),...,4,] y V = [v,,v,, ...,V,], el componente ¡-ésimo de u + v 
es u; + v; y el componente ¿-ésimo de cv sólo es cv,. 

Dado que en R” ya no se pueden dibujar vectores, es importante poder calcularlos. 
Debe tener cuidado de no suponer que la aritmética vectorial será similar a la aritmética 
de números reales. Con frecuencia lo es, y los cálculos algebraicos que se hacen con vec- 
tores son similares a los que se harían con escalares. Pero, en secciones posteriores se en- 
contrarán situaciones donde el álgebra vectorial es muy diferente a la experiencia previa 
con números reales. Por ello es importante verificar cualquier propiedad algebraica 
antes de intentar usarla. 

Una de tales propiedades es la conmutatividad de la adición: u + v = v + u para los 
vectores u y v. Esto ciertamente es verdadero en R?. Geométricamente, la regla punta a 
origen muestra que tanto u + v como v + u son las diagonales principales del paralelo- 
gramo determinado por u y v. (La regla del paralelogramo también refleja esta simetría; 
vea la figura 1.17.) 

Note que la figura 1.17 es simplemente una ilustración de la propiedad u + v = v + u. 
No es una demostración, pues no abarca todo caso posible. Por ejemplo, también deben 
incluirse los casos donde u = v, u = —v y u = 0. (¿Cómo serían los diagramas para estos 
casos?) Por esta razón, es necesaria una demostración algebraica. Sin embargo, es tan 
fácil dar una demostración que sea válida en R”, como dar una que sea válida en R?. 

El siguiente teorema resume las propiedades algebraicas de la suma vectorial y la 
multiplicación escalar en R”. Las demostraciones se obtienen de las propiedades corres- 
pondientes de los números reales. 
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Teorema 1.1 


La palabra teorema se deriva de la 
palabra griega theorema, que a su 
vez proviene de una palabra que 
significa “mirar a”. Por ende, un 
teorema se basa en la compren- 
sión que se adquiere cuando se 
observan los ejemplos y de ellos se 
extraen propiedades cuya aplica- 
ción en general se intenta demos- 
trar. De igual modo, cuando se 
comprende algo en matemáticas, 
por ejemplo, la demostración de 
un teorema, con frecuencia se dice 
“ya veo”. 


Figura 1.18 


Propiedades algebraicas de los vectores en R” 


Sean u, v y w vectores en R” y sean c y d escalares. Entonces 


a U+vV=v>+u Commutatividad 
b. (u+v) + w=u+(v+w) Asociatividad 
c.u+0=u 
d. u + (-u)=0 
e. clu + v) = cu + cv Distributividad 
f. (c + d)u = cu + du Distributividad 
g. c(du) = (cd)u 
h. lu=u 

Comentarios 


+ Las propiedades (c) y (d), junto con la propiedad de conmutatividad (a) impli- 
can también que 0 +u=uy-—u+u=0, 

e Silas propiedades distributivas (e) y (f) se leen de derecha a izquierda, dicen que 
es posible factorizar un escalar común o un vector común a partir de una suma. 


Demostración Se demuestran las propiedades (a) y (b) y las demostraciones de las pro- 


piedades restantes se dejan como ejercicios. Sea u = [u,,4,,...,4,),v = [Yp V» ... >] 
yw = [w,w, ..., w,). 
(a) u+v=[4,4),...,4,] + [Vi Vo.. Va] 
= [u] + Vth t Vo... ,14, PY] 
= [y Fup tt Uy... , 1, + 4,] 
[Mi Vuia V] + [4,, 4), ..., 4, 
=v+u 


La segunda y cuarta igualdades son por la definición de suma vectorial, y la tercera igual- 
dad es por la conmutatividad de la suma de números reales. 


(b) La figura 1.18 ilustra la asociatividad en [R?. Algebraicamente, se tiene 


(u + v) +w = ([4, tz... Un] + [v,V...,V,]) + [Wi w,...,w,] 


= [u + 9,0) + VW... Un E Vp] + [w,w..., Wp] 
= |(u + v) + ws (u + v) + w,...,(4, + va) + w,] 


= [u + (v + wi), 0, + (v, + w),..., 4, + (v, + w,)] 


= [4,4 ..., 4,4] + [vi + Wava + W...,Vp t wal 
= [4,4 ..., Ua] + ([Yp Y -.. Va] + [Wi Wa ... > w]) 
=u + (v+w) 


La cuarta igualdad es por la asociatividad de la suma de números reales. Note el uso cui- 
dadoso de los paréntesis. 
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Por la propiedad (b) del Teorema 1.1, puede escribirse sin ambigúedades u + v + w 
sin paréntesis, pues los sumandos pueden agruparse en cualquier forma que se quiera. 
Por (a), también se pueden reordenar los sumandos si se quiere, por ejemplo, como w + 
u + v. Del mismo modo, las sumas de cuatro o más vectores pueden calcularse sin im- 
portar el orden o agrupamiento. En general, si V}, V} . . . , V son vectores en R”, tales 
sumas se escribirán sin paréntesis: 


vi tv teet wv 


Fl siguiente ejemplo ilustra el uso del Teorema 1.1 en la realización de cálculos alge- 
braicos con vectores. 


Ejemplo 1.5 


Sean a, b y x vectores en R”. 
(a) Simplifique 3a + (5b — 2a) + 2(b — a). 
(b) Si 5x — a = 2(a + 2x), despeje x en términos de a. 


Solución Ambas soluciones se darán con detalle, haciendo con referencia a todas las 
propiedades en el Teorema 1.1 que se utilicen. Es buena práctica justificar todos los pasos 
las primeras veces que haga este tipo de cálculos. Sin embargo, una vez se sienta cómodo 
con las propiedades vectoriales, es aceptable dejar fuera algunos de los pasos intermedios 
para ahorrar tiempo y espacio. 


(a) Comience por insertar paréntesis. 


3a + (5b — 2a) + 2(b — a) (5b — 2a)) + 2(b — a) 


= (3a + 
= (3a + (—2a + 5b)) + (2b — 2a) (a), (e) 
= ((3a + (—2a)) + 5b) + (2b — 2a) (b) 
((3 + (22))a + 5b) + (2b — 2a) (£) 


= (la + 5b) + (2b — 2a) 

= ((a + 5b) + 2b) — 2a (b), (h) 
= (a + (5b + 2b)) — 2a (b) 

= (a + (5 + 2)b) — 2a (£) 

= (7b + a) — 2a (a) 

= 7b + (a — 2a) (b) 

= 7b + (1 — 2)a (£), (h) 
=7b + (—1)a 

=7b-a 


¡Puede ver por qué estará de acuerdo en omitir algunos de estos pasos! En la práctica es 
aceptable simplificar esta secuencia de pasos como 


3a + 5b — 2a + 2b — 2a 


(3a — 2a — 2a) + (5b + 2b) 
—a + 7b 


3a + (5b — 2a) + 2(b — a) 


o incluso hacer la mayoría de los cálculos mentalmente. 
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(b) En detalle, se tiene 
5x — a = 2(a + 2x) 
5x — a = 2a + 2(2x) (e) 
5x — a = 2a + (2-2)x (g) 
5x — a = 2a + 4x 
(5x — a) — 4x = (2a + 4x) — 4x 
(—a + 5x) — 4x = 2a + (4x — 4x) (a), (b) 


—a + (5x — 4x) = 2a + 0 (b), (d) 
a + (5 — 4)x = 2a (£), (c) 
—a + (1)x = 2a 
a+(—a+x)=a+2a (h) 
(a + (—a)) + x= (1 + 2)a (b), (£) 
0+x= 3a (d) 
x= 3a (c) 
De nuevo, usualmente se omitirán la mayoría de estos pasos. < 


Se dice que un vector que sea una suma de múltiplos escalares de otros vectores es una 
combinación lineal de dichos vectores. A continuación se presenta la definición formal. 


Definición Un vector v es una combinación lineal de vectores v}, V», . . . , Vy Si 
existen escalares c}, C,, . . . , C tales que v = civ; + cV, + *** + CWy Los escalares c,, 
©... C se llaman coeficientes de la combinación lineal. 
> 
Ejemplo 1.6 a el A a 
El vector | —2 | es una combinación lineal de | 0|,| —3 | y | —4 |, pues 
=] =1 1 0 
1 2 5 2 
31 0|+2|-3 4|= 2 
=] 1 0 = 


Comentario Determinar si un vector dado es una combinación lineal de otros vec- 
tores es un problema que se abordará en el capítulo 2. 


En R?, es posible bosquejar combinaciones lineales de dos vectores (no paralelos) de 
manera muy conveniente. 


Ejemplo 1.7 


> 
3 


a yv= Al Puede usar u y v para ubicar un nuevo conjunto de ejes (en la 


Sean u = | 


1 0 
misma forma que e, = o ye, = | i | ubican los ejes coordenados estándar). Puede usar 
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Figura 1.19 


estos nuevos ejes para determinar una cuadrícula coordenada que permitirá ubicar fá- 
cilmente combinaciones lineales de u y v. 

Como muestra la figura 1.19, w puede ubicarse comenzando en el origen y avanzar 
—u seguido por 2v. Esto es, 


w= —u + 2v 


Se dice que las coordenadas de w con respecto a u y v son —1 y 2. (Note que esta es sólo 
otra forma de pensar en los coeficientes de la combinación lineal.) Se concluye que 


“EI 


(Observe que —1 y 3 son las coordenadas de w con respecto a e, y e,.) 


a 


Cambiar de los ejes coordenados estándar a los alternativos es una idea útil. Tiene 
aplicaciones en química y geología, pues las estructuras moleculares y cristalinas con fre- 
cuencia no se adaptan a una cuadrícula rectangular. Es una idea que se encontrará repe- 
tidamente en este libro. 


También encontrará un tipo de vector que no tiene interpretación geométrica, al menos 
no con el uso de la geometría euclidiana. Las computadoras representan los datos en tér- 
minos de 0 y 1 (que se puede interpretar como apagado/encendido, cerrado/abierto, 
falso/verdadero o no/sí). Los vectores binarios son vectores cuyos componentes son un 
0 o un 1. Como verá en la sección 1.4, tales vectores surgen naturalmente en el estudio 
de muchos tipos de códigos. 

En este escenario deben modificarse las reglas usuales de la aritmética, pues el resul- 
tado de cada cálculo que involucra escalares debe ser un 0 o un 1. A continuación se pro- 
porcionan las reglas modificadas para suma y multiplicación. 


elo 1 -Jo 1 
JE US. 
1110 ılo 1 


La única curiosidad aquí es la regla de que 1 + 1 = 0. Esto no es tan extraño como parece; 
si sustituye 0 con la palabra “par” y 1 con la palabra “impar”, estas tablas simplemente 
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resumen las familiares reglas de paridad para la suma y multiplicación de enteros pares e 
impares. Por ejemplo, 1 + 1 = 0 expresa el hecho de que la suma de dos enteros impares 
es un entero par. Con estas reglas, el conjunto de escalares {0, 1} se denota mediante Z, 
y se llama el conjunto de enteros módulo 2. 


Ejemplo 1.8 


Se usa el término longitud de ma- 
nera diferente a la forma en como 
se usa en R”. Esto no debe confun- 
dirlo, pues no hay noción geomé- 
trica de longitud para vectores bi- 


narios. 


> 
EnzZ,1+1+0+1=1y1+1+1+1=0. (Estos cálculos ilustran nuevamente las 
reglas de paridad: la suma de tres impares y un par es impar; la suma de cuatro impares 


es par.) 


Con Z, como el conjunto de escalares, ahora las reglas anteriores se extienden a los 
vectores. El conjunto de todas las n-adas de 0 y 1 (con toda la aritmética realizada en mó- 
dulo 2) se denota mediante Z}. Los vectores en Z; se llaman vectores binarios de longi- 
tud n. 


Ejemplo 1.9 


> 
Los vectores en Z3 son [0, 0], [0, 1], [1, 0] y [1, 1]. (En general, ¿cuántos vectores con- 


tiene Z3?) 


Ejemplo 1.10 


=> 
Sean; u = [1, 1,0, 1,0] y v = [0, 1, 1, 1, 0] dos vectores binarios de longitud 5. Encuen- 
tre u.v. 


Solución El cálculo de u » v tiene lugar en Z,, de modo que se tiene 


u:v=1:+0+1:-1+0-1>+1-1+0-+0 
=0+1+0+1>+0 


E -t 


Es posible generalizar lo que se acaba de hacer para vectores binarios a vectores cuyos 
componentes se tomen de un conjunto finito {0, 1,2,..., k} para k = 2. Para hacerlo, pri- 
mero debe ampliarse la idea de aritmética binaria. 


Ejemplo 1.11 


> 
Los enteros módulo 3 es el conjunto Z, = (0, 1, 2) con suma y multiplicación dadas por 
las siguientes tablas: 


O N eje 
— O NIN 
o 
o o ojo 
N = Ol|r 
— N OIN 


Observe que el resultado de cada suma y multiplicación pertenece al conjunto 
{0, 1, 2}; se dice que Z es cerrado con respecto a las operaciones de suma y multiplica- 
ción. Tal vez sea más sencillo pensar en este conjunto en términos de un reloj de 3 horas 
con 0, 1 y 2 en su carátula, como se muestra en la figura 1.20. 

El cálculo 1 + 2 = 0 se traduce del modo siguiente: 2 horas después de la 1 en punto 
es 0 en punto. Así como 24:00 y 12:00 son lo mismo en un reloj de 12 horas, del mismo 
modo 3 y 0 son equivalentes en este reloj de 3 horas. Igualmente, todos los múltiplos de 
3, positivos y negativos, aquí son equivalentes a 0; 1 es equivalente a cualquier número 
que sea 1 más que un múltiplo de 3 (como —2, 4 y 7); y 2 es equivalente a cualquier nú- 
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mero que sea 2 más que un múltiplo de 3 (como —1, 5 y 8). Se puede visualizar la recta 
numérica como enredada en torno a un círculo, como se muestra en la figura 1.21. 


0 
== O iaa 
2 1 
E 0 E A E A 
Figura 1.20 
Módulo aritmético Figura 1.21 | 


Ejemplo 1.12 


¿A qué es equivalente 3548 en Z,? 


Solución Esto es lo mismo que preguntar dónde se encuentra 3548 en el reloj de 
3 horas. La clave es calcular cuán lejos está el número del múltiplo de 3 más cercano (más 
pequeño); es decir, es necesario conocer el residuo cuando 3548 se divide entre 3. Por di- 
visión larga, se encuentra que 3548 = 3 + 1182 + 2, de modo que el residuo es 2. Por tanto, 


3548 es equivalente a 2 en Z}. 


En cursos de álgebra abstracta y teoría de números, que exploran este concepto con 
mayor detalle, la equivalencia anterior con frecuencia se escribe como 3548 = 2 (mod 3) 
o 3548 = 2 (mod 3), donde = se lee “es congruente con”. Aquí no se usará esta notación 
o terminología. 


Ejemplo 1.13 


> 
En Z,, calcule 2 +2 +1 +2. 


Solución 1 Use las mismas ideas que en el ejemplo 1.12. La suma ordinaria es 2 + 2 + 
1 + 2 = 7, que es 1 más que 6, de modo que la división entre 3 deja un residuo de 1. Por 
ende, 2 +2 +1 +2= 1 en Z. 


Solución 2 Una mejor forma de realizar este cálculo es hacerlo paso a paso completa- 
mente en Z,. 


24+2+1+2=(2+2)+1+2 


14142 
=(1+1)+2 
=2+2 
=] 
Aquí se usaron paréntesis para agrupar los términos elegidos para combinar. Podría ace- 


lerar las cosas al combinar simultáneamente los primeros dos y los últimos dos térmi- 
nos: 


(2+2)+(1+2) 


1+0 
=1 
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La multiplicación repetida se puede manejar de manera similar. La idea es usar las tablas 
de suma y multiplicación para reducir el resultado de cada cálculo a 0, 1 o 2. 


La extensión de estas ideas a los vectores es directa. 


Ejemplo 1.14 En Z3, sean u = [2, 2,0, 1,2] yv = [1, 2, 2, 2, 1]. Entonces 
u:v=2:1+2:2+0:2+ 1:2+2-1 
=2+1+0+2+2 
=1 
Los vectores en Z3, se conocen como vectores ternarios de longitud 5. T 
En general, se tiene el conjunto Z,,, = {0, 1, 2,..., m — 1} de enteros módulo m (que 


corresponde a un reloj de m horas, como se muestra en la figura 1.22). Un vector de lon- 
gitud n cuyas entradas están en Z,, se llama vector m-ario de longitud n. El conjunto de 
Figura 1.22 todos los vectores m-arios de longitud n se denota por Z j. 


Módulo aritmético m 


|Hercicios 1.1 E 


1. Dibuje los siguientes vectores en posición estándar en ten el viaje del caminante y dibuje un vector que repre- 
R’. sente el desplazamiento neto del caminante desde el 
3 9) punto de partida. 
a) a= b) b = 
sa | 3l hi | 5 
=9 3 Los ejercicios 7-10 se refieren a los vectores en el ejercicio 1. 
l c= | | (d) d = | | Calcule los vectores indicados y también muestre cómo pueden 
3 =2 obtenerse geométricamente los resultados. 
2. Dibuje los vectores del ejercicio 1 con sus orígenes en el 7.a+b 8.b+c 
punto (1, —3). 9.d-c 10.a—d 
3. Dibuje los siguientes vectores en posición estándar en 
R’. 


Los ejercicios 11 y 12 se refieren a los vectores en el ejercicio 3. 
(a) a = [0,2, 0] (b) b = [5,2, 1] Calcule los vectores indicados. 
emka da= ES] 11. 2a + 3c 12. 2c — 3b — d 

4. Si los vectores en el ejercicio 3 se trasladan de modo que 
sus puntas estén en el punto (1, 2, 3), encuentre los pun- 
tos que correspondan a sus orígenes. 


13. Encuentre los componentes de los vectores u, v, u + v y 
u — v, donde u y v son como se muestra en la figura 


1,23, 
5. Para cada uno de los siguientes pares de puntos, dibuje 


el vector AB. Luego calcule y vuelva a dibujar AB como 14. En la figura 1.24, A, B, C, D, E y Fson los vértices de un 


un vector en posición estándar. hexágono regular con centro en el origen. 

(a) A = (1, —1), B = (4,2) Exprese > cada uno de los siguientes vectores en términos 
(b) A = (0, —2), B = (2, —1) de a = OA yb = OB: 

(c) A = (2,3), B = (3, 3) (a) AB (b) BC 


(d) A = (53) B = (63) 
6. Un paseante camina 4 km al norte y luego 5 km al no- T. TR 
reste. Dibuje los vectores desplazamiento que represen- (e) AC (£) BC + DE + FA 


(c) AD (d) CF 


Figura 1.23 

y 
A 

C B 

D A 
> xX 
E F 
Figura 1.24 


En los ejercicios 15 y 16, simplifique la expresión vectorial dada. 
Indique cuáles propiedades usó del Teorema 1.1. 


15. 2(a — 3b) + 3(2b + a) 
16. —3(a — c) + 2(a + 2b) + 3(c — b) 


En los ejercicios 17 y 18, despeje el vector x en términos de los 
vectores a y b. 


17.x— a= 2(x — 2a) 
18. x + 2a — b = 3(x + a) — 2(2a — b) 


En los ejercicios 19 y 20, dibuje los ejes coordenados con respecto 
au y v y localice w. 


19. u = | 


=2 2 
20. = | Dr [Ejes -u- 2 
3 1 


En los ejercicios 21 y 22, dibuje los ejes coordenados estándar en 
el mismo diagrama que los ejes con respecto a u y v. Úselos para 
encontrar w como una combinación lineal de u y v. 
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nue [iv ie- [7 
220 e [2 


23. Dibuje diagramas para ilustrar las propiedades (d) y (e) 
del Teorema 1.1. 
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24. Proporcione demostraciones algebraicas de las propie- 
dades (d) a (g) del Teorema 1.1. 


En los ejercicios 25-28, u y v son vectores binarios. Encuentre u 
+ vyu: ven cada caso. 


1 1 

0 1 
sn a ee 
0 1 


27.u = [1,0,1,1], v = [1,1,1,1] 

28. u = [1, 1,0, 1,0], v = [0, 1, 1, 1, 0] 

29. Escriba las tablas de suma y multiplicación para Z,. 
30. Escriba las tablas de suma y multiplicación para Z,. 


En los ejercicios 31-43, realice los cálculos indicados. 

31.2 +2 + 2en Z 32. 2: 2.2 en Z, 

33. 2(2 + 1 + 2)enZ;, 34.3 +1 +2 + 3enZ, 
35.2-3-2enZ, 36. 3(3 + 3 + 2) en Z, 
37.2+1+2+2+1enZ,Z, y Z 

38. (3 + 4)(3 + 2 + 4 + 2) en Z, 

39. 8(6 +4 + 3)enZ, 40. 2” en Z, 

41. [2,1,2] + [2,0, 1] en Z; 42.[2, 1,2]. [2,2,1] en Z3 
43. [2, 0, 3, 2] + ([3, 1, 1,2] + [3, 3, 2, 1]) en Zi y en Z4 


En los ejercicios 44-55, resuelva la ecuación dada o indique 
que no hay solución. 


44. x + 3 = 2en Z; 45. x +5 = 1 en Z 
46. 2x = 1 en Z; 47. 2x = l1 en Z, 
48. 2x = 1 en Z; 49. 3x = 4en Z; 
50. 3x = 4 en Zs 51. 6x = 5 en Z; 
52. 8x = 9 en Z 53. 2x + 3 = 2en Z; 


54. 4x + 5 = 2 en Zs 55. 6x + 3 = 1 en %4; 
56. (a) ¿Para qué valores de a, x + a = 0 tiene solución en 


Z? 

(b) ¿Para qué valores de a y b, x + a = b tiene solución 
en Z¿ 

(c) ¿Para qué valores de a, b y m, x + a = b tiene solu- 
ción en Z,,? 


57. (a) ¿Para qué valores de a, ax = 1 tiene solución en Z;? 
(b) ¿Para qué valores de a, ax = 1 tiene solución en Z¿ 
(c) ¿Para qué valores de a y m, ax = 1 tiene solución en 
La 
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Longitud y ángulo: el producto punto 


Es muy sencillo reformular los conceptos geométricos familiares de longitud, distancia y 
ángulo en términos de vectores. Hacerlo permitirá usar estas importantes y poderosas 
ideas en escenarios más generales que R° y R’. En capítulos posteriores, estas simples he- 
rramientas geométricas se usarán para resolver una gran variedad de problemas que sur- 
gen en aplicaciones, ¡aun cuando aparentemente no haya ninguna geometría! 


Las versiones vectoriales de longitud, distancia y ángulo pueden describirse usando la 
noción de producto punto de dos vectores. 


Definición si 


ul vi 

uz va 
ms ¿ NÓ : 

Un Va 


entonces el producto punto u - v de u y v se define mediante 


uU- Y = UV, + UV, EE UV, 


En palabras, u - v es la suma de los productos de los componentes correspondientes de u 
y v. Es importante notar un par de cosas acerca de este “producto” que se acaba de defi- 
nir: primero, u y v deben tener el mismo número de componentes. Segundo, el producto 
punto u - v es un número, no otro vector. (Es por esto que u - v en ocasiones se conoce 
como el producto escalar de u y v.) El producto punto de vectores en R” es un caso es- 
pecial e importante de la noción más general de producto interno, que se explorará en el 
capítulo 7. 


Ejemplo 1.15 


Calcule u-Y cuando u=| 2| y v=| 5 


Solución u-v=1-(-3)+2-5+(-3)-2=1 


-l 


Note que si en el ejemplo 1.15 se hubiera calculado v + u, se habría obtenido 
vu =(=3)-1+5:2+2-(-3) =1 


Es algo que, en general, u - v = v + u, pues los productos individuales de los componentes 
se conmutan. Esta propiedad de conmutatividad es una de las propiedades del producto 
punto que se usarán repetidamente. Las principales propiedades del producto punto se 
resumen en el Teorema 1.2. 
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Teorema 1.2 


Sean u, v y w vectores en R”, y sea c un escalar. Entonces 
u'v=v'u Conmutatividad 
.u(v+w)=u:v+u:w Distributividad 
(cu) - v = c(u- v) 

u:u=0 y u-u=O0siysólo siu = 0 


ES 


Demostración Se demostrarán (a) y (c), y la demostración de las propiedades restantes 
se dejará para los ejercicios. 


(a) Al aplicar la definición de producto punto au : Y y v+ u se obtiene 
U.V = UY, + UV) + +: + UNa 
= Y/U] + VU) + *** + VU 
= v-u 


donde la segunda igualdad es consecuencia del hecho de que la multiplicación de nú- 
meros reales es conmutativa. 


(c) Con las definiciones de multiplicación escalar y producto punto, se tiene 


(cu) +v = [cu CU), ..., CU] [Vi Vo... > Vn] 
= CUY, + CUN + *** + CU, V,, 


= c(uv, + uv, + + UV,a) 


clu. v) 


Comentarios 

+ La propiedad (b) puede leerse de derecha a izquierda, en cuyo caso se dice que se 
puede factorizar un vector común u a partir de una suma de productos punto. Esta 
propiedad también tienen un análogo de “mano derecha” que procede de las propiedades 
(b) y (a) juntas: (v + w)-«u=v + u + we-u 

e La propiedad (c) puede extenderse para dar u- (cv) = c(u + v) (ejercicio 58). 
Esta versión extendida de (c) dice en esencia que, al tomar un múltiplo escalar de un 
producto punto de vectores, el escalar puede combinarse primero con cualquier vector 
que sea más conveniente. Por ejemplo, 


G[-1, =3, 2]) - [6, 4, 0] = [-1, 3, 2] -([6, 4, 0]) = [-1, =3, 2] - [3, 2, 0] = 3 


Con este enfoque se evita la introducción de fracciones en los vectores, como ocurriría 
en el agrupamiento original. 

+ La segunda parte de (d) usa el conectivo lógico si y sólo si. El Apéndice A discute 
esta frase con más detalle, pero por el momento note solamente que la frase señala una 
doble implicación, a saber 


siu = 0, entonces u:u=0 


y siu-u = 0, entonces u = 0 


El Teorema 1.2 muestra que algunos aspectos del álgebra de vectores recuerdan el ál- 
gebra de números. El siguiente ejemplo muestra que en ocasiones es posible encontrar 
análogos vectoriales de identidades familiares. 


20 Capítulo 1 Vectores 


| . 


Ejemplo 1.16 Demuestre que (u + v)» (u + v) = u-u + 2(u-v) + v» v para todos los vectores u y 
ven R’. 
Solución (u + v) (u + v) = (u + v)-u + (u + v)-v 
=u: u +v:u+u'v+v.v 
=Uu:uU +u'v+u'v+v'v 
=u: u + 2(u-v) + v-v 
»—» (Identifique las partes del Teorema 1.2 que se usaron en cada paso.) E 
r Longitud 
Mi v= A Para ver cómo el producto punto desempeña un papel en el cálculo de longitudes, recuerde 


3 cómo se calculan longitudes en el plano. El teorema de Pitágoras es todo lo que necesita. 


Ivl = ZE 
En R?, la longitud del vector v = H es la distancia desde el origen hasta el punto 


(a, b) que, por el teorema de Pitágoras, está dada por Va? + b’, como en la figura 1.25. 
Observe que a? + b? = v- v. Esto conduce a la siguiente definición. 


Figura 1.25 Y 


A A v. 
Definición La longitud (o norma) de un vectorv = | ° | en R” es el escalar no 


negativo ||v|| definido por è 
Vn 


[vi = Viv = VE 


En palabras, la longitud de un vector es la raíz cuadrada de la suma de los cuadrados 
de sus componentes. Note que la raíz cuadrada de v - v siempre está definida, pues 
v-v = 0 por el Teorema 1.2(d). Note también que la definición puede reescribirse para 
dar ||v||? = v + v, que será útil para probar más propiedades del producto punto y las lon- 
gitudes de vectores. 


Ejemplo 1.17 [2,3] = V2? + 3? = v13 


El Teorema 1.3 menciona algunas de las principales propiedades de la longitud vec- 
torial. 


Sea v un vector en R” y sea c un escalar. Entonces 
r : y 


a. |v = 0 si y sólo si v = 0 


b. [lev] = Iellivl 


Demostración La propiedad (a) es consecuencia inmediata del Teorema 1.2(d). Para 
demostrar (b), se tiene 


[cv]? = (cv) (ev) = è(v: v) = elv? 


usando el Teorema 1.2(c). Al sacar la raíz cuadrada de ambos lados, y con el hecho de 
que Y c? = |c| para cualquier número real c, se obtiene el resultado. O z 
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Un vector de longitud 1 se llama vector unitario. En R?, el conjunto de todos los vec- 
tores unitarios puede identificarse con el círculo unitario, el círculo de radio 1 con centro 
en el origen (vea la figura 1.26). Dado cualquier vector v distinto de cero, siempre es posi- 
ble encontrar un vector unitario en la misma dirección que v al dividir v por su propia lon- 
gitud (o, de manera equivalente, al multiplicar por 1/||v||). Esto se puede demostrar alge- 
braicamente al usar la propiedad (b) del Teorema 1.3 anterior: si u = (1/||v|| )v, entonces 


la = E/I = MA iv) = GADI = 1 


y u está en la misma dirección que v, ya que 1/[|v| es un escalar positivo. Encontrar un 
vector unitario en la misma dirección con frecuencia se conoce como normalizar 
un vector (vea la figura 1.27). 


v 
DA 
A 
lvl 
Figura 1.26 Figura 1.27 
Vectores unitarios en R? Normalización de un vector 


Ejemplo 1.18 


> 
1 


0 
los cuadrados de sus componentes es 1 en cada caso. De igual modo, en R? pueden cons- 
truirse vectores unitarios 


0 en 
En RR? sea e, = | | ye = | i Entonces e, y e, son vectores unitarios, ya que la suma de 


1 0 0 
e =|0| e =|1 y e=|0 
0 0 1 


Observe en la figura 1.28 que estos vectores sirven para localizar los ejes coordenados 


positivos en R? y RÌ. 
z 


E 


e] 


Figura 1.28 


Vectores unitarios estándar en R° y R? 
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En general, en R”, se definen vectores unitarios e,, e, . . . , €,, donde e, tiene 1 en su 
i-ésimo componente y ceros en cualquier otra parte. Tales vectores surgen de manera re- 
petida en álgebra lineal y se llaman vectores unitarios estándar. 


Ejemplo 1.19 


2 
Normalice el vector v = | —1 
3 


Solución | w| = Y 2? + (1)? + 3? = y14, de modo que un vector unitario en la 


misma dirección que v está dado por 


2 2/V14 
u = (vv =(1/V19)| -1 | = | -1/v1a 


3 3/ V14 = 


Puesto que la propiedad (b) del Teorema 1.3 describe cómo se comporta la longitud 
con respecto a la multiplicación escalar, la curiosidad natural sugiere que se pregunte si 
la longitud y la suma vectorial son compatibles. Sería excelente tener una identidad 
como [u + v|| = ul| + ||vl|, pero para casi cualquier elección de vectores u y v esto re- 
sulta ser falso. [Vea el ejercicio 52(a).] Sin embargo, no todo está perdido, pues resulta 
que, si se sustituye el signo = con <, la desigualdad resultante es verdadera. La 
demostración de este famoso e importante resultado, la desigualdad del triángulo, se 
apoya en otra importante desigualdad, la de Cauchy-Schwarz, que se probará y discutirá 
con más detalle en el capítulo 7. 


Teorema 1.4 


AA 


u v 


Figura 1.29 
La desigualdad del triángulo 


La desigualdad de Cauchy-Schwarz 


Para todos los vectores u y v en R”, 


lu: v| = fulll 


Vea en los ejercicios 71 y 72 los planteamientos algebraico y geométrico para la demos- 
tración de esta desigualdad. 

En R? o R?, donde se puede usar geometría, es claro a partir de un diagrama como el 
de la figura 1.29 que |u + v|| = [ul + [wi para todos los vectores u y v. Ahora se de- 
mostrará que esto es verdadero en general. 


Teorema 1.5 


La desigualdad del triángulo 


Para todos los vectores u y v en R”, 


lu + v]| = [Jul] + [vi 
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Demostración Dado que ambos lados de la desigualdad son no negativos, demostrar 
que el cuadrado del lado izquierdo es menor o igual que el cuadrado del lado derecho 
equivale a demostrar el teorema. (¿Por qué?) Calcule 


|u + v|? = (u + v)- (u + v) 

u-u + 2(u-v) + v+v  Porelejemplo 1.9 
ul? + 2]u- v] + [v]? 

< lu? + 2 ul Iv] + vw]? Por Cauchy-Schwarz 
= (llull + Iv? 


lA 


como se requirió. 


La distancia entre dos vectores es el análogo directo de la distancia entre dos puntos en la 
recta numérica real o entre dos puntos en el plano cartesiano. Sobre la recta numérica (fi- 
gura 1.30), la distancia entre los números a y b está dada por la = b|. (Tomar el valor ab- 
soluto garantiza que no es necesario conocer cuál de a o b es mayor.) Esta distancia tam- 
bién es igual a Y (a — b)?, y su generalización bidimensional es la familiar fórmula para 
la distancia d entre los puntos (a, a,) y (b,, b,), a saber, d = Y (a, — b,Y + (a, — b,). 


a b 
> 
-2 0 3 

Figura 1.30 
d= |a - b| = |-2 - 3| =5 


; . b . : 
En términos de vectores, si a = | | yb = | i entonces d es justo la longitud de a — b, 


a 
a b, 


como se muestra en la figura 1.31. Esta es la base para la siguiente definición. 


A (ay, a2) 


(aj, a2) 


l 
l 
l 
l 
¡a — bz 
l 
l 
l 
| 


tl 


(bi, b2) a -— bi 


Figura 1.31 
d Vía; bi? + (a, — b} = lla — b|| 


Definición La distancia d(u, v) entre los vectores u y v en R” se define por 


d(u, v) = |u — v| 
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Figura 1.33 


Ejemplo 1.20 


> 
v2 0 
Encuentre la distancia entre u = l|yv=| 2). 
= =2 
v2 
Solución Calcule u — v = | —1 |, de modo que 
1 


d(u, v) = |u — v| = V(V2? + 1? + 1 = va =2 


El 


El producto punto también se puede usar para calcular el ángulo entre un par de vecto- 
res. En R? o R?, el ángulo entre los vectores u y v distintos de cero se referirá al ángulo 0 
determinado por estos vectores que satisfaga 0 < 0 <= 180” (vea la figura 1.32). 


50 3 


v u M 
Figura 1.32 


El ángulo entre u y v 


En la figura 1.33, considere el triángulo con lados u, v y u — v, donde 6 es el ángulo 
entre u y v. Al aplicar la ley de cosenos a este triángulo se produce 


lu = vi? = ul? + [iv]? — 2] ul liv] cos 6 
Al desarrollar el lado izquierdo y usar ||v||? = v-v varias veces, se obtiene 
lal? = 2(u- y) + Ivi? = lull? + Ivl? = 2) ul [v] cos 6 


que, después de simplificar, nos deja con u+ v = [ul | v[| cos 6. A partir de esto se obtiene 
la siguiente fórmula para el coseno del ángulo 0 entre vectores u y v distintos de cero. Se 
establece como una definición. 


Definición Para vectores u y v distintos de cero en R”, 
u.v 


cos O = 
[ful [v] 


Ejemplo 1.21 


Calcule el ángulo entre los vectores u = [2, 1, —2] yv = [1, 1, 1]. 


Sección 1.2 Longitud y ángulo: el producto punto 25 


Solución Calcule u-v = 2-1 + 1:1 + (—2):1 = 1 Jul = y 2? + 1? + (-2) = 
V9 =3 y lv] = V1? + 1? + 1? = V3. Por tanto, cos 9 = 1/343, de modo que 0 = 
cos” '(1/34/3) = 1.377 radianes o 78.9. i 


> 
Ejemplo 1.22 Calcule el ángulo entre las diagonales de dos caras adyacentes de un cubo. 


Solución Las dimensiones del cubo no importan, así que se trabajará con un cubo con 
lados de longitud 1. Oriente el cubo en relación con los ejes coordenados en R*, como se 
muestra en la figura 1.34, y tome las dos diagonales laterales como los vectores [1, 0, 1] y 
[0, 1, 1]. Entonces el ángulo 0 entre dichos vectores satisface 


1-0+0-1+1-1 1 
V2V2 2 


cos O = 


de donde se concluye que el ángulo requerido es 7/3 radianes o 60°. 


Z: 


Figura 1.34 


(En realidad, no es necesario hacer cálculo alguno para obtener esta respuesta. Si di- 
buja una tercera diagonal lateral que una los vértices en (1, 0, 1) y (0, 1, 1), obtiene un 
triángulo equilátero, pues todas las diagonales laterales tienen igual longitud. El ángulo 
que se quiere es uno de los ángulos de este triángulo y por tanto mide 60°. En ocasiones 
un poco de perspicacia puede ahorrar muchos cálculos; en este caso, ¡brinda una buena 


comprobación de su trabajo!) | 


Comentarios 

+ Como lo demuestra esta discusión, por lo general tendrá que establecer una 
aproximación del ángulo entre dos vectores. Sin embargo, cuando el ángulo es uno de los 
llamados especiales (0°, 30°, 45°, 60°, 90° o un múltiplo entero de ellos), deberá recono- 
cer su coseno (tabla 1.1) y por ende proporcionar el ángulo correspondiente con exacti- 
tud. En todos los demás casos se usará una calculadora o computadora para aproximar 
el ángulo deseado mediante la función coseno inverso. 


Tabla 1.1 Cosenos de ángulos especiales 


0 0° 30° 45° 60° 90° 
VA v3 V2 1 VI VO 

cos 0 =] = = =0 
2 2 2 V2 2 2 2 
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La palabra ortogonal se deriva de la 
palabras griegas orthos, que signi- 
fica “derecho, recto”, y gonia, que 
significa “ángulo”. Por tanto, orto- 
gonal literalmente significa “en án- 
gulo recto”. El equivalente latino es 


rectangular. 


+ La deducción de la fórmula para el coseno del ángulo entre dos vectores es válida 
solamente en R°? y R°, pues depende de un hecho geométrico: la ley de los cosenos. En 
R”, para n > 3, la fórmula puede considerarse como una definición. Esto tiene sentido, 

u-v u-v 
IF lvl 


pues la desigualdad de Cauchy-Schwarz implica que 


< 1, de modo que 
| IF liv] 


varía de —1 a 1, tal como hace la función coseno. 


El concepto de perpendicularidad es fundamental para la geometría. Quien estudie geo- 
metría rápidamente se dará cuenta de la importancia y utilidad de los ángulos rectos. 
Ahora se generalizará la idea de la perpendicularidad para los vectores en R”, donde se le 
llama ortogonalidad. 

En R? o RR?, dos vectores u y v distintos de cero son perpendiculares si el ángulo 0 
entre ellos es un ángulo recto; esto es, si 9 = 7/2 radianes o 90°. Por tanto, lam = 


cos 90° = 0, y se concluye que u « v = 0. Esto motiva la siguiente definición. 


Definición Dos vectores u y ven R” son mutuamente ortogonales si u -v = 0. 


Dado que 0 - Y = 0 para todo vector v en R”, el vector cero es ortogonal a todo 
vector. 


Ejemplo 1.23 


En R?, u = [1, 1, -2] yv = [3, 1, 2] son ortogonales, pues u:v=3+1-—4=0, 


Al usar la noción de ortogonalidad, se obtiene una sencilla demostración del teo- 
rema de Pitágoras, válida en R”. 


Teorema 1.6 


utv 


Figura 1.35 


Teorema de Pitágoras 


Para todos los vectores u y v en R”, |u + vi? = [jul]? + ||vl|? si y sólo si u y v son orto- 
gonales. 


Demostración A partir del ejemplo 1.16, se tiene |u + v|? = |u? +2(u + v) + ||v||? para 
todos los vectores u y v en R”. Se concluye inmediatamente que [ju + v|? = |u? + Ivl]? 
si y sólo siu. v = 0. Vea la figura 1.35. e 


El concepto de ortogonalidad es uno de los más importantes y útiles en álgebra li- 
neal, y con frecuencia surge en formas sorprendentes. El capítulo 5 contiene un trata- 
miento detallado del tema, pero se le encontrará muchas veces antes. Un problema en el 
que claramente tiene un papel es al encontrar la distancia desde un punto hacia una 
recta, donde “trazar una perpendicular” es un paso familiar. 


Figura 1.37 


La proyección de v sobre u 
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Proyecciones 


Ahora se considerará el problema de encontrar la distancia desde un punto hasta una 
recta en el contexto de los vectores. Como verá, esta técnica conduce a un importante 
concepto: la proyección de un vector sobre otro vector. 

Como muestra la figura 1.36, el problema de encontrar la distancia desde un punto B 
hasta una recta Le (en R? o R°) se reduce a encontrar la longitud del segmento de recta 
perpendicular PB o, de manera equivalente, la longitud del vector PB. Si se elige un 
punto A sobre £, entonces, en el triángulo recto AAPB, B, los otros dos vectores son el ca- 
teto AP y la hipotenusa AB. AP se llama proyección de AB sobre la recta €. Ahora observe 
esta situación en términos de vectores. 


¿A 


Figura 1.36 


La distancia desde un punto hasta una recta 


Considere dos vectores u y v distintos de cero. Sea p el vector que se obtiene al trazar 
una perpendicular desde la punta de v sobre u y sea 0 el ángulo entre u y v, como se 
muestra en la figura 1.37. Entonces, claramente p = [p|ú, donde ù = (1/[u|| Ju es el vec- 
tor unitario en la dirección de u. Más aún, por trigonometría elemental [p|| = ||vl| cos 6, 


u.v 
lulllivi 


e= MA 
~ (T 
nY 


Ésta es la fórmula que se quería, y es la base de la siguiente definición para vectores 
en R”. 


y se sabe que cos O = Por tanto, después de sustituir, se obtiene 


Definición si u y v son vectores en R” y u % 0, entonces la proyección de v 
sobre u es el vector proy,(v) definido por 


proy.(v) = ( erja 


En el ejercicio 73 se describe una forma alternativa de obtener esta fórmula. 
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1 vV 
i 
i 
i 0 
I SN 
== 
proyu(v) y 
Figura 1.38 
y 
pea 


Comentarios 

e FEl término proyección proviene de la idea de proyectar una imagen sobre un 
muro (con un proyector de diapositivas, por ejemplo). Imagine un haz de luz con rayos 
mutuamente paralelos y perpendiculares a u que brillan sobre v. La proyección de v 
sobre u es justo la sombra formada, o proyectada, por v sobre u. 

+ Puede ser útil considerar a proy, (v) como una función con variable v. Entonces 
la variable v ocurre sólo una vez en el lado derecho de la definición. Además, es útil tener 
en mente la figura 1.38, que recuerda que proy, (v) es un múltiplo escalar del vector u (no 
de v). 

+ Aunque en la deducción de la definición de proy, (v) se requirió que tanto v 
como u fuesen distintos de cero (¿por qué?), es claro a partir de la geometría que la 
proyección del vector cero sobre u es 0. La definición está en concordancia con esto, pues 


u-0 
(En), - 0u =0. 
u'u 


e Siel ángulo entre u y v es obtuso, como en la figura 1.38, entonces proy„(v) es- 
tará en la dirección opuesta de u; esto es, proy, (v) será un múltiplo escalar negativo de u. 
e Siu esun vector unitario, entonces proy,(v) = (u + v)u. (¿Por qué?) 


Ejemplo 1.24 


Encuentre la proyección de v sobre u en cada caso. 


1 


=I 2 

() v=| e y u= [è (b) v= y Uu=e; 
1 1/2 

(c) v=|2| y u= 1/2 
3 1 v2 


2| |-1 21 |2 
(a) Calcule u + v = HB] | =1yuu= HB = 5, de modo que 


proy,(v) = (a = H Z [a 


(b) Puesto que e, es un vector unitario, 


0 
proye (v) T (e, - v)e, = 3e, = |0 
3 
(c) Se ve que |u] = Viti +4 = 1. Por tanto, 
1/2 1/2 
proy,(v) = (u: v)u = G +1+ 3) 1/2 |= uva 1/2 
1/ V2 1/V2 
NERA 
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Ejercicios 1.2 


En los ejercicios 1-6, encuentre u-v. 227. Ejercico 21 “$ 28. Ejercico 22 “$ 29, Ejercico 23 
Es =1 o3 JS 2 _ 9 30. Sea A = (—3, 2), B = (1,0) y C = (4, 6). Pruebe que 
a A | EES AE T |g AABC es un triángulo recto. 

1 2 1.5 3.0 31. Sea A = (1,1, — 1), B = (-3,2, —2), y C = (2,2, —4). 
3.u=|2 | v=13| Y 4u= 0.4 |, v= 5.2 Pruebe que AABC es un triángulo rectángulo. 

3 1 -2.1 0.6 “42 32. Encuentre el ángulo entre una diagonal de un cubo y 
5. u = [1, V2, V3, 0], v = [4, — V2, 0, =5] una arista adyacente. 

as 6. u = [1.12, —3.25, 2.07, — 1.83], 33. Un cubo tiene cuatro diagonales. Demuestre que nin- 
v = [-2.29, 1.72, 4.33, — 1.54] gún par de ellas son perpendiculares. 


En los ejercicios 34-39, encuentre la proyección de v sobre u. 


Dibuje un bosquejo para los ejercicios 34 y 35. 
En los ejercicios 7-12, encuentre |u|| para el ejercicio dado y 


; de dd 34. Un paralelogramo tiene diagonales determinadas por 
proporcione un vector unitario en la dirección de u. 


los vectores 


7. Ejercicio 1 8. Ejercicio 2 9. Ejercicio 3 
2 1 
“AS 10, Ejercicio4 11. Ejercicio5 “$12. Ejercicio 6 iela easa 
0 3 


En los ejercicios 13-16, encuentre la distancia d(u, v) entre u 


rene erido dad: Demuestre que el paralelogramo es un rombo (todos 


los lados de igual longitud) y determine la longitud del 
13. Ejercicio 1 14. Ejercicio 2 lado. 


15. Ejercicio 3 TA Ejercicio 4 35. El rectángulo ABCD tiene vértices en A = (1, 2, 3), 
B = (3,6, —2) y C = (0, 5, —4). Determine las coorde- 
nadas del vértice D. 


17. Si u, v y w son vectores en R”, n = 2 y c es un escalar, 
explique por qué las siguientes expresiones no tienen 
sentido: 36. Un avión se dirige hacia el este con una velocidad de 

200 millas por hora. Un viento sopla del norte a 40 mi- 

llas por hora. ¿Cuál es la velocidad resultante del 

(c) u-(v-w) (d) c-(u + w) avión? 


(a) |u. vl] (b) u-v + w 


37. Un bote se dirige al norte a través de un río con una 
velocidad de 4 millas por hora. Si la corriente fluye al 
este con una velocidad de 3 millas por hora, encuentre 
la velocidad resultante del bote. 


En los ejercicios 18-23, determine si el ángulo entre u y v es 
agudo, obtuso o recto. 


2 1 2 1 38. Ann conduce un bote de motor a través de un río que 
18. u = 1P- 19. u = | —1 |v = | —2 tiene 2 km de ancho. El bote tiene una rapidez de 
1 =1 20 km/h en aguas quietas, y la corriente en el río fluye 


a 5 km/h. Ann parte desde una orilla en el río hacia un 

muelle directamente frente a ella en la ribera opuesta. 

cS 21. u = [0.9, 2.1, 1.2], v = [-4.5, 2.6, —0.8] Ella conduce el bote en una dirección perpendicular a 
la corriente. 


20. u = [5, 4, —3],v = [1, —2, —1] 


e AA ma (a) ¿Cuán lejos río abajo del muelle llegará Ann? 


23. u = [1,2,3,4], v = [5,6,7,8] (b) ¿Cuánto tardará Ann en cruzar el río? 


39. Bert puede nadar a un ritmo de 2 millas por hora en 
aguas quietas. La corriente en un río fluye con una ve- 
locidad de 1 milla por hora. Si Bert quiere nadar a tra- 
vés del río hasta un punto directamente opuesto, ¿a 

24. Ejercico 18 25. Ejercico 19 26. Ejercico 20 qué ángulo con la orilla del río debe nadar? 


En los ejercicios 24-29, encuentre el ángulo entre u y v en el 
ejercicio dado. 
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En los ejercicios 40-45, encuentre la proyección de v sobre u. 
Dibuje un bosquejo para los ejercicios 40 y 41. 


waf f] a.u-[%]+-[ 


1 a) 
2/3 2 S a 
42. u = | —2/3 |, v = | —2 | 43. u = dal MES 
-1/3 2 
/ —1 -2 
[a] [il 
44, u = v= 
1.5 1.2 
3.01 1.34 
45. u = | —0.33 | v=| 425 
2.52 —1.66 


La figura 1.39 sugiere dos formas en las que pueden 
usarse los vectores para calcular el área de un trián- 
gulo. El área A del triángulo en el inciso (a) está dada 
por [Jul [ly — proya(v)||, y el inciso (b) sugiere la 
forma trigonométrica del área de un triángulo: 


v 


A 


Figura 1.39 


(b) 


A = Jul | visenó. (Puede usar la identidad 


send =V 1 — cos” O para encontrar sen 0.) 


En los ejercicios 46 y 47, calcule el área del triángulo con los 
vértices dados usando ambos métodos. 


46. A = (1, —1), B = (2,2), C = (4,0) 
47. A = (3, —1, 4), B = (4, —2, 6), C = (5, 0, 2) 


En los ejercicios 48 y 49, encuentre todos los valores del esca- 
lar k para el cual los dos vectores son ortogonales. 


1 k? 
2 k+1 

48. u = v= 49.u=|-1|v=| k 
3 k-1 

2 3 


Š Px 
50. Describa todos los vectores v = | que son ortogo- 


nales a u = A 
1 


51. Describa todos los vectores v = 
i A l 
nales a u = ; 
b 


52. En qué condiciones los siguientes son verdaderos para 
vectores u y v en R° o R? 


(a) |lu +vl| = llul] + [lv] 


x 
| que son ortogo- 


(b) [lu +v] = [ful] — Iivi 
53. Demuestre el Teorema 1.2(b). 
54. Demuestre el Teorema 1.2(d). 


En los ejercicios 55-57, demuestre la propiedad enunciada de 
la distancia entre vectores. 


55. d(u, v) = d(v, u) para todos los vectores u y v. 

56. d(u, w) = d(u, v) + d(v, w) para todos los vectores u, 
vyw 

57. d(u, v) = 0 si y sólo si u = v 


58. Demuestre que u- cv = c(u - v) para todos los vectores 
u y v en R” y todo escalar c. 


59. Demuestre que [ju — v]| = [Jul] — liv] para todos los 
vectores u y v en R”. [Sugerencia: sustituya u por u — v 
en la desigualdad del triángulo. ] 


60. Suponga que usted sabe que u -v = u w. ¿Se deduce 
que v = w? Si es así, proporcione una demostración que 
sea válida en R”; de otro modo, proporcione un con- 
traejemplo (esto es, un conjunto específico de vectores 
u, v y w para los cuales u - v = u -w pero v + w). 


61. Demuestre que (u + v): (u — v) = llull? — |v? para 
todos los vectores u y v en R”. 
62. (a) Demuestre que lju + v|? + |lu — vi? = 2llul? + 
2lvl? para todos los vectores u y v en R”. 
(b) Dibuje un diagrama que muestre u, v, u + V y u-v 
en R° y use (a) para deducir un resultado acerca de 
los paralelogramos. 


2 1 2 
63. Demuestre que u.v = ze + v|? — ze — v| 


para todos los vectores u y v en R”. 


64. (a) Demuestre que |u + v]| = lju — v]| si y sólo si u y v 
son ortogonales. 
(b) Dibuje un diagrama que muestre u, v, u + vy u-v 
en R° y use (a) para deducir un resultado acerca de 
los paralelogramos. 


65. (a) Demuestre que u + v y u— v son ortogonales en R” 
si y sólo si [Jul] = [|vl|. 

(b) Dibuje un diagrama que muestre u, v, u + Vyu-— v 
en R° y use (a) para deducir un resultado acerca de 
los paralelogramos. 

66. Si jul] = 2, [lv] = V3, y u - v = 1, calcule |u + vl|. 
67. Demuestre que no hay vectores u y v tales que llul| = 1, 

[v| =2 y u- v =3. 

68. (a) Demuestre que si u es ortogonal tanto a v como a 
w, entonces u es ortogonal a v + w. 

(b) Demuestre que si u es ortogonal tanto a vcomo a 
w, entonces u es ortogonal a sv + tw para todos 
los escalares s y t. 


69. Demuestre que u es ortogonal a v — proy, (v) para 
todos los vectores u y v en R”, donde u + 0. 


70. (a) Demuestre que proy, (proy,(v)) = proy,(v). 
(b) Demuestre que proy,(v — proy,(v)) = 0. 
(c) Explique (a) y (b) geométricamente. 

71. La desigualdad de Cauchy-Schwarz |u » v| = llull l|v]| es 
equivalente a la desigualdad que se obtiene al elevar al 
cuadrado ambos lados: (u + v)? < Jul]? Iv}. 


vı ; 
, esto se convierte 


(a) En R? con u = a yv= 
U v 


en 
(uv, + um) = (uz + ui + v7) 


Demuestre esto algebraicamente. [Sugerencia: reste el 
lado izquierdo del lado derecho y demuestre que la di- 
ferencia necesariamente debe ser no negativa. ] 

(b) Demuestre el análogo de (a) en R°. 
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72. En la figura 1.40 se sugiere otro método para demos- 
trar la desigualdad de Cauchy-Schwarz, donde se 
muestra que, en R? o R’, ||proya(v)|| = Ivl]. Demues- 
tre que esto es equivalente a la desigualdad de Cauchy- 
Schwarz. 


proyu(v) u 
Figura 1.40 


73. Use el hecho de que proy, (v) = cu para algún escalar 
c junto con la figura 1.41, para encontrar c y con ello 
deducir la fórmula para proy, (v). 


y= cu 


cu u 


Figura 1.41 


74. Con inducción matemática, demuestre la siguiente ge- 
neralización de la desigualdad del triángulo: 


[vi + va +++ va = val + [vall + + + + + val 


para todo n = 1. 


E l jó 


Vectores y geometría 


Muchos resultados en geometría euclideana plana pueden demostrarse con el uso de téc- 
nicas vectoriales. Por ejemplo, en el ejemplo 1.24 se usaron vectores para demostrar el 
teorema de Pitágoras. En esta exploración se usarán vectores para desarrollar demostra- 
ciones para algunos otros teoremas de la geometría euclideana. 

Como introducción a la notación y el procedimiento básico, considere el siguiente 
ejemplo sencillo. 


Ejemplo 1.25 


Figura 1.42 
El punto medio de AB 


A 
Figura 1.43 


> 
Proporcione una descripción vectorial del punto medio M de un segmento de recta AB. 


Solución Primero convierta todo a notación vectorial. Si O denota el origen y P es un 
punto, sea p el vector OP. En esta situación, a = OA, b = OB, m OM yAB = OB — 
OA=b-a (figura 1.42). 

Ahora, dado que M es el punto medio de AB, se tiene 


m a = AM = ŻAB = }(b a) 
de modo que m = a + 3(b — a) = 3(a + b) } 


1. Proporcione una descripción vectorial del punto P que está a un tercio del 
camino entre A y B sobre el segmento de recta AB. Generalice. 


2. Pruebe que el segmento de recta que une los puntos medios de dos lados de un 
triángulo es Paralelo al al tercer lado y tiene la mitad de la longitud. (En notación vectorial, 
pruebe que PQ = LAB en la figura 1.43.) 


3. Pruebe que el cuadrilátero PQRS (figura 1.44), cuyos vértices están en los pun- 
tos medios de los lados de un cuadrilátero arbitrario ABCD, es un paralelogramo. 


4. Una mediana de un triángulo es un segmento de recta desde un vértice hasta el 
punto medio del lado opuesto (figura 1.45). Pruebe que las tres medianas de cualquier 
triángulo son concurrentes (es decir: tienen un punto de intersección común) en un 
punto G que está a dos tercios de la distancia desde cada vértice hasta el punto medio del 
lado opuesto. [Sugerencia: en la figura 1.46 se muestra que el punto que está a dos tercios 
de la distancia de A a P está dado por ¿(a + b + c). Entonces demuestre que 
(a + b + c) es dos tercios la distancia de B a Q y dos tercios la distancia de C a R.] El 
punto G en la figura 1.46 se llama centroide del triángulo. 


5. La altura de un triángulo es un segmento de recta desde un vértice y que es per- 
pendicular al lado opuesto (figura 1.47). Demuestre que las tres alturas de un triángulo 
son concurrentes. [Sugerencia: sea H el punto de intersección de las alturas desde A y B 


A 
B 
A R 
Q e . 
S M B 
P 
E C C 
2 R Figura 1.45 Figura 1.46 
Figura 1.44 Una mediana El centroide 
en la figura 1.48. Pruebe que CH es ortogonal a AB.] El punto H en la figura 1.48 se 
llama ortocentro del triángulo. 

6. Un bisector perpendicular de un segmento de recta es una recta que pasa por el 
punto medio del segmento, perpendicular a él (figura 1.49). Demuestre que los bisecto- 
res perpendiculares de los tres lados de un triángulo son concurrentes. [Sugerencia: sea 
K el punto de intersección de los bisectores perpendiculares de AC y BC en la figura 1.50. 
Demuestre que RK es ortogonal a AB.] El punto K en la figura 1.50 se conoce como cir- 
cuncentro del triángulo. 

C 
A l i B 
A e B T T 
Figura 1.47 Figura 1.48 Figura 1.49 
Una altura El ortocentro Un bisector perpendicular 

7. Sean A y B los puntos extremos de un diámetro de un círculo. Si C es cualquier 
punto sobre la circunferencia, demuestre que 4ACB es un ángulo recto. [Sugerencia: en 
la figura 1.51, sea O el centro del círculo. Exprese todo en términos de a y c y demuestre 
que AC es ortogonal a BC. ] 

8. Demuestre que los segmentos de recta que unen los puntos medios de lados 
opuestos de un cuadrilátero se bisecan mutuamente (figura 1.52). 

C C 
Q P 
A B 
K 
A B 
k D 

AONE Aa Figura 1.52 
Fl circuncentro Figura 1.51 
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Rectas y planos 


Todos están familiarizados con la ecuación de una recta en el plano cartesiano. Ahora se 
considerarán rectas en R? desde un punto de vista vectorial. La comprensión que se ob- 
tenga a partir de este planteamiento permitirá generalizar a rectas en R° y luego a planos 
en R’. Mucha del álgebra lineal que se considerará en capítulos posteriores tiene sus orí- 
genes en la geometría simple de rectas y planos; la habilidad para visualizarlos y pensar 
geométricamente en torno a un problema le servirá bastante. 


Rectas en R? y R? 


En el plano xy, la forma general de la ecuación de una recta es ax + by = c. Si b + 0, en- 
tonces la ecuación puede reescribirse como y = —(a/b)x + c/b, que tiene la forma y = 
mx + k. [Ésta es la forma pendiente ordenada al origen; m es la pendiente de la recta y el 
punto con coordenadas (0, k) es su ordenada al origen.] Para incluir los vectores en este 
estudio, considere un ejemplo. 


Ejemplo 1.26 


La palabra latina norma se refiere a 
una escuadra de carpintero que se 
usaba para dibujar ángulos rectos. 
Por ende, un vector normal es aquel 
que es perpendicular a algo más, 
por lo general un plano. 


> 


En la figura 1.53 se muestra la recta €, con ecuación 2x + y = 0. Es una recta con pen- 
diente —2 que pasa por el origen. El lado izquierdo de la ecuación está en la forma de 


. 2 x ; ; 
producto punto; de hecho, si n = H yx= | | entonces la ecuación se convierte 
y 


en n - x= 0. El vector n es perpendicular a la recta; esto es, es ortogonal a cualquier vec- 
tor x que sea paralelo a la recta (figura 1.54) y se le conoce como vector normal a la recta. 
La ecuación n - x= 0 es la forma normal de la ecuación de €. 

Otra forma de pensar esta recta es imaginar una partícula que se mueve a lo largo de 
la recta. Suponga que la partícula inicialmente está en el origen en el tiempo t = 0 y se 
mueve a lo largo de la recta en tal forma que su coordenada x cambia 1 unidad por se- 
gundo. Entonces, en t = 1 la partícula está en (1, —2), en t = 1.5 está en (1.5, —3) y si se 
permiten valores negativos de t (esto es, considera dónde estuvo la partícula en el pa- 


sado), en t = —2 está (o estuvo) en (—2, 4). Este movimiento se ilustra en la figura 1.55. 
y y 
A A 


Figura 1.53 Figura 1.54 


La recta 2x + y = 0 Un vector normal n 
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En general, si x = t, entonces y = —2t, y esta relación se puede escribir en forma vecto- 
rial como 


NA 1 f 
¿Cuál es el significado del vector d = | l Es un vector particular paralelo a £, lla- 
mado vector director para la recta. Como se muestra en la figura 1.56, puede escribir la 
ecuación de € como x = td. Esta es la forma vectorial de la ecuación de la recta. 
Si la recta no pasa por el origen, entonces deben modificarse ligeramente las cosas. 


Figura 1.56 
Figura 1.55 Un vector de dirección d 


Ejemplo 1.27 


> 


Considere la recta € con ecuación 2x + y = 5 (figura 1.57). Esta es justo la recta del ejem- 
plo 1.26 desplazada 5 unidades arriba. También tiene pendiente —2, pero su ordenada al 
origen es el punto (0, 5). Es claro que los vectores d y n del ejemplo 1.26 son, respectiva- 
mente, un vector director y un vector normal también a esta recta. 

Por ende, n es ortogonal a cada vector que sea paralelo a £. El punto P = (1, 3) está 
sobre €. Si X = (x, y) representa un punto general sobre €, entonces el vector PX=x- p 
es paralelo a € y n » (x — p) = 0 (vea la figura 1.58). Al simplificar, se tiene n * x = n • p. 
Como comprobación, calcule 


vi y eE 


Por tanto, la forma normal n - x = n + p sólo es una representación diferente de la forma 
general de la ecuación de la recta. (Note que en el ejemplo 1.26, p fue el vector cero, de 
modo que n - p = 0 produjo el lado derecho de la ecuación.) 
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La palabra parámetro, y el corres- 
pondiente adjetivo paramétrica, 
provienen de las palabras griegas 
para, que significa “a lo largo de, 
junto a”, y metron, que significa 
e : e 
medir”. En lenguaje matemático, 
un parámetro es una variable en 
términos de la cual se expresan 
otras variables: una nueva “me- 
dida” se coloca junto a las anterio- 
res. 


Figura 1.57 Figura 1.58 
La recta 2x + y = 5 n*(x-p)=0 


Estos resultados conducen a la siguiente definición. 


Definición La forma normal de la ecuación de una recta € en R? es 
n:(x-=p)=0 o n-x=n:p 
donde p es un punto específico sobre € y n + 0 es un vector normal a £. 


a 
La forma general de la ecuación de € es ax + by = c, donde n = | j es un vec- 
tor normal para £. 


Continuando con el ejemplo 1.27, ahora se encontrará la forma vectorial de la ecua- 
ción de €. Note que, para cada elección de x, x — p debe ser paralelo a, y por tanto múl- 
tiplo de, el vector director d. Esto es x — p = td ox = p + td para algún escalar t. En tér- 
minos de componentes, se tiene 


ABE o 
y 3 =2 
o =F 

y=3-2t (2) 

La ecuación (1) es la forma vectorial de la ecuación de €, y las ecuaciones en compo- 
nentes (2) se llaman ecuaciones paramétricas de la recta. La variable t se conoce como pa- 
rámetro. 

¿Cómo se generaliza todo esto a R% Observe que las formas vectorial y paramétrica 
de las ecuaciones de una recta se trasladan perfectamente. La noción de la pendiente de 
una recta en [R?, que es difícil de generalizar a tres dimensiones, se sustituye por la no- 
ción más conveniente de vector director, lo que conduce a la siguiente definición. 


Definición La forma vectorial de la ecuación de una recta € en R? o R? es 
x=p+td 
donde p es un punto específico sobre € y d + 0 es un vector director para €. 


Las ecuaciones que corresponden a los componentes de la forma vectorial de la 
ecuación se llaman ecuaciones paramétricas de £. 
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Con frecuencia, esta terminología se abreviará ligeramente, y se hará referencia simple- 
mente a las ecuaciones general, normal, vectorial y paramétrica de una recta o plano. 


> 

Ejemplo 1.28 | Encuentre las ecuaciones vectorial y paramétrica de la recta en R? que pasa por el punto 
5 
P = (1,2, —1), paralela al vector d = | —1 
3 


Solución La ecuación vectorial x = p + td es 


x 1 3 

y|= Ze «et =l 

Z =1 3 
La forma paramétrica es x= 1+>5t 
y= 2> t 


Comentarios 

e Las formas vectorial y paramétrica de la ecuación de una recta dada € no son 
únicas; de hecho, existen infinitas formas, pues es posible usar cualquier punto sobre € 
para determinar p y cualquier vector director para €. Sin embargo, claramente todos los 
vectores directores son múltiplos mutuos. 


10 
En el ejemplo 1.28, (6, 1, 2) es otro punto sobre la recta (considere t = 1) y | —2 | es 
otro vector director. Por tanto, 6 


x 6 10 
y|=|1|+s| -2 
z 2 6 


proporciona una ecuación vectorial diferente (pero equivalente) para la recta. La rela- 
ción entre los dos parámetros s y t puede encontrarse al comparar las ecuaciones para- 
métricas: para un punto dado (x, y, z) sobre €, se tiene 


x= 1+5t=6+10s 
2= t=1- 25 
z=-1+3t=2+ 6s 


lo que implica que 


=10s+ 5t= 5 
2s— t=-—1 
=6s+ 3t= 3 


Cada una de dichas ecuaciones se reduce a t = 1 + 2s. 
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e Intuitivamente se sabe que una recta es un objeto unidimensional. La idea de “di- 
mensión” se aclarará en los capítulos 3 y 6, pero por el momento observe que esta idea 
parece concordar con el hecho de que la forma vectorial de la ecuación de una recta re- 
quiere un parámetro. 


Figura 1.59 


n es ortogonal a un número infinito 


de vectores 


Ejemplo 1.29 


n 
TA E 
op 
K 
Figura 1.60 
n-(x-p)=0 


> 
Con frecuencia, uno escucha la expresión “dos puntos determinan una recta”. Encuentre 
una ecuación vectorial de la recta € en R? determinada por los puntos P = (—1, 5, 0) y 


Q = (2, 1, 1). 


Solución Es posible elegir cualquier punto sobre € para p, de modo que se usará P (Q 
también estaría bien). 


3 
Un vector director conveniente es d = PQ = | —4 | (o cualquier múltiplo escalar de 
éste). Por tanto, se obtiene 1 
x=p+td 
=1 3 
= 5| +t| —4 


=> -+ 


La siguiente pregunta que debe plantearse es: ¿cómo la forma general de la ecuación de 
una recta se generaliza a R°? Razonablemente puede suponer que si ax + by = c es la 
forma general de la ecuación de una recta en R?, entonces ax + by + cz = d puede re- 
presentar una recta en R°. En forma normal, esta ecuación sería n - x= n - p, donde n es 
un vector normal a la recta y p corresponde a un punto sobre la recta. 
Para ver si esta es una hipótesis razonable, considere el caso especial de la ecua- 
a 


Planos en Ri 


ción ax + by + cz = 0. En forma normal, se convierte en n - x = 0, donde n = | b 
c 
Sin embargo, el conjunto de todos los vectores x que satisfacen esta ecuación es el con- 
junto de todos los vectores ortogonales a n. Como se muestra en la figura 1.59, vectores 
en infinitas direcciones tienen esta propiedad, lo que determina una familia de planos 
paralelos. De modo que la suposición fue incorrecta: parece que ax + by + cz = d es la 
ecuación de un plano, no de una recta, en R?. 
Precise más este hallazgo. Todo plano FP en R? puede determinarse al especificar un 
punto p sobre P y un vector distinto de cero n normal a P (figura 1.60). Por ende, 
si x representa un punto arbitrario sobre %W, se tiene que n » (x — p)=00n-x=n-p. 


a x 
sin=|b|yx= | y |, entonces, en términos de componentes, la ecuación se convierte 
g z 


en ax + by + cz = d (donde d = n: p). 


Definición La forma normal de la ecuación de un plano P en R? es 
n:(x-p)=0 o n-x=n'p 


donde p es un punto específico sobre P y n % 0 es un vector normal para P. 
a 


La forma general de la ecuación de P es ax + by + cz = d, donde n = | b | es un 
vector normal para 2. E 
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Note que cualquier múltiplo escalar de un vector normal para un plano es otro vec- 
tor normal. 


> 
Ejemplo 1.30 Encuentre las formas normal y general de la ecuación del plano que contiene el punto 
1 
P = (6,0, 1) y tiene un vector normal n = | 2 
x 
Solución Conp=|0|yx=|y|setienen:p=1+6+2-0+ 3-1 = 9, de mo- 
1 z 


do que la ecuación normal n - x = n - p se convierte en la ecuación general x + 2y + 
3z =9. 


Geométricamente, es claro que planos paralelos tienen los mismos vectores norma- 
les. Por tanto, sus ecuaciones generales tienen lados izquierdos que son múltiplos mu- 
tuos. De este modo, por ejemplo, 2x + 4y + 6z = 10 es la ecuación general de un plano 
que es paralelo al plano del ejemplo 1.30, ya que la ecuación puede reescribirse como x + 
2y + 3z = 5, de donde se ve que los dos planos tienen el mismo vector normal n. (Note 
que los planos no coinciden, pues los lados derechos de sus ecuaciones son distintos.) 

También puede expresar la ecuación de un plano en forma vectorial o paramétrica. 
Para hacerlo, observe que un plano también puede determinarse al especificar uno de 
sus puntos P (por el vector p) y dos vectores directores u y v paralelos al plano (pero no 
mutuamente paralelos). Como muestra la figura 1.61, dado cualquier punto X en el 


Figura 1.61 


x—-p=su+ttv 


plano (ubicado por x), siempre se pueden encontrar múltiplos adecuados su y tv de los 
vectores directores tales que x — p = su + tvor x = p + su + tv. Si esta ecuación se es- 
cribe en forma de componentes, se obtienen ecuaciones paramétricas para el plano. 


Definición La forma vectorial de la ecuación de un plano P en R° es 
x=pt su tty 
donde p es un punto sobre Y y u, y v son vectores directores para P (u y v son dis- 
tintos de cero y paralelos a P, mas no mutuamente paralelos). 
Las ecuaciones correspondientes a los componentes de la forma vectorial de la 
ecuación se llaman ecuaciones paramétricas de P. 
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Ejemplo 1.31 


Figura 1.62 


Dos normales determinan una recta 


Figura 1.63 
La intersección de dos planos 
es una recta 


Encuentre ecuaciones vectoriales y paramétricas para el plano del ejemplo 1.30. 


Solución Es necesario encontrar dos vectores directores. Se tiene un punto, P = (6, 0, 
1), en el plano; si puede encontrar otros dos puntos Q y R en %, entonces los vectores 
PQ y PR pueden servir como vectores directores (a menos que, por mala suerte, ¡resul- 
ten ser paralelos!). Mediante ensayo y error se observa que Q = (9, 0, 0) y R = (3, 3, 0) 
satisfacen la ecuación general x + 2y + 3z = 9 y por tanto yacen en el plano. Entonces se 
calcula 


3 =3 
u PQ q-p 0f y v=PR=r-p= 3 
=] =] 


que, dado que no son múltiplos escalares mutuos, servirán como vectores directores. Por 
tanto, se tiene la ecuación vectorial de P 


x 6 3 =9 
y|=|0|+s| O+ 3 
Z 1 =1 =1 


y las correspondientes ecuaciones paramétricas, 


x=6+3s-— 3t 


y= 3t 
z=1=s- t 
[¿Qué habría ocurrido si hubiera escogido R = (0, 0, 3)?] č 


Comentarios 

e Un plano es un objeto bidimensional, y su ecuación, en forma vectorial o 
paramétrica, requiere dos parámetros. 

e Como muestra la figura 1.59, dado un punto P y un vector distinto de cero n en 
RR”, existen infinitas rectas a través de P con n como vector normal. Sin embargo, P y dos 
vectores normales no paralelos n, y n, sirven para ubicar una recta € de manera única, 
pues € debe ser entonces la recta que pasa a través de P perpendicular al plano con 
ecuación x = p + sn, + tn, (figura 1.62). En consecuencia, una recta en R? también 
puede especificarse mediante un par de ecuaciones 


ax +by+cz=d, 
ax + by + oz = d; 


que corresponden a cada vector normal. Pero, dado que dichas ecuaciones corresponden 
a un par de planos no paralelos (¿por qué no paralelos?), esta es justo la descripción de 
una recta como la intersección de dos planos no paralelos (figura 1.63). Algebraica- 
mente, la recta consiste de todos los puntos (x, y, z) que satisfacen simultáneamente 
ambas ecuaciones. Este concepto se explorará más en el capítulo 2, cuando se estudie la 
solución de los sistemas de ecuaciones lineales. 

Las tablas 1.2 y 1.3 resumen la información presentada hasta el momento acerca de 
las ecuaciones de rectas y planos. 

Observe una vez más que una sola ecuación (general) describe una recta en R?, pero 
un plano en R’. [En dimensiones superiores, un objeto (recta, plano, etcétera) determi- 
nado por una sola ecuación de este tipo por lo general se conoce como hiperplano.] La 
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Tabla 1.2 Ecuaciones de rectas en R? 


Forma normal Forma general Forma vectorial Forma paramétrica 
n:-x=n-p ax+by=c x=p+id po 
y = p, + td) 


Tabla 1.3 Rectas y planos en R° 
Forma normal Forma general Forma vectorial Forma paramétrica 
Rectas a :*X=nM"P; pe + byy+cz=d, x=p+td x= p, + td, 
Nn),*X = n’ pP ax + by + c,2 =d, y = p + td, 
z= p, + td; 
Planos n:-x=n-p ax+by+cz=d X=p+su+ tv x= pı + su, + tv, 


y = Pi + Su, + tv, 
z = p; + su; + tv; 


relación entre la dimensión del objeto, el número de ecuaciones requeridas y la dimen- 
sión del espacio está dada por la “fórmula de balanceo”: 


(dimensión del objeto) + (número de ecuaciones generales) = dimensión del espacio 


Mientras más grande sea la dimensión del objeto, menos ecuaciones se necesitan. 
Por ejemplo, un plano en R? es bidimensional, requiere una ecuación general y existe en 
un espacio tridimensional: 2 + 1 = 3. Una recta en R? es unidimensional y por tanto ne- 
cesita 3 — 1 = 2 ecuaciones. Note que la dimensión del objeto también concuerda con el 
número de parámetros en su forma vectorial o paramétrica. Las nociones de “dimen- 
sión” se aclararán en los capítulos 3 y 6, pero por el momento le servirán estas observa- 
ciones intuitivas. 

Ahora puede encontrar la distancia desde un punto hasta una recta o un plano al 
combinar los resultados de la sección 1.2 con los de esta sección. 


> 


Ejemplo 1.32 


Encuentre la distancia desde el punto B = (1, 0, 2) hasta la recta € a través del punto 


= 
A = (3, 1, 1) con vector director d = 1 
0 


Solución Como ya se determinó, es necesario calcular la longitud de PB, donde P es el 
punto sobre € al pie de la perpendicular desde B. Si se etiqueta v = AB, entonces AP = 
proya(v) y PB =v- proya(v) (vea la figura 1.64). Los cálculos necesarios se realizaron 
en varios pasos. 


Paso 1: v = AB = b a=]|0 1| = 
2. 1 1 
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y v — proyg(v) 
f 
d 
P 
proya(v) 
Figura 1.64 
d(B, €) = ||v — proya(v)|| 
Paso 2: La proyección de v sobre d es 
d-v 
=| = ld 
eE 
(A + 1-(-1) + 2) 
E -1 +1+0 
(1) ; 
=] 
=} 1 
0 
e 
2 
= a 
2 
] 
Paso 3: El vector que se quiere es 
2114 f= 
y poy) = [1 [| 5|=|- 
1 0 1 
Paso 4: La distancia d(B, €) desde B hasta € es 
i 
2 
|v — proyo) = [| = 
1 


-3 

|v = proyav)l => [|| =3 
=3V9+9+4 
=3V22 


Nota 
+ En términos de nuestra notación anterior, d(B, €) = d(v, proy¿(v)). 
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En el caso donde la recta € está en R? y su ecuación tiene la forma general ax + by = c, 
la distancia d(B, €) desde B = (xo yyJestá dada por la fórmula 


laxo Tbh- c| 


w 5 


Se le invita a demostrar esta fórmula en el ejercicio 39. 


Ejemplo 1.33 


> 


Encuentre la distancia desde el punto B = (1, 0, 2) hasta el plano P cuya ecuación gene- 
ralesx+y=z=1l. 


Solución En este caso es necesario calcular la longitud de PB, donde P es el punto sobre 
P al pie de la perpendicular desde B. Como muestra la figura 1.65, si A es cualquier 
1 
punto sobre P y el vector normal n = 1 | de Y se sitúa de modo que su origen esté 

=1 


— 
en A, entonces es necesario encontrar la longitud de la proyección de AB sobre n. Nue- 
vamente, los cálculos necesarios se hacen en pasos. 


Figura 1.65 
d(B, P) = [proy,(AB)| 


Paso 1: Mediante ensayo y error se encuentra cualquier punto cuyas coordenadas sa- 
tisfagan la ecuación x + y — z = 1. A = (1,0, 0) lo hará. 


Paso 2: Sea 1 


1 0 
v=AB=b-a=10 o|=|0 
2 0 2 


Paso 3: La proyección de v sobre n es 


proy,(v) = (z)h 


(=e 1-0 — a) 
XX 1+1+(21? 


l 


II 
| 
I 
— 
II 
l 
WIN WIN WIN 
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Paso 4: La distancia (B, P)desde B hasta P es 


1 
[rom == 1 
1 
1 
=] 
= 3V3 


En general, la distancia d(B, P) desde el punto B = (xy, Yo Zo) hasta el plano cuya 
ecuación general es ax + by + cz = d está dada por la fórmula 


d(B, P) 


D laxo + e e d| 


Va? + b? + ec? 


(4) 


En el ejercicio 40 se le pedirá deducir esta fórmula. 


Ejercicios 1.3 


l 


En los ejercicios 1 y 2, escriba la ecuación de la recta que pasa 
por P con vector normal n en (a) forma normal y (b) forma 
general. 
3 3 
1. P = (0,0), n = 2.P = (2,1), n = 
vonf] arenai] 
En los ejercicios 3-6, escriba la ecuación de la recta que pasa 


por P con vector director d en (a) forma vectorial y (b) forma 
paramétrica. 


3. P = (1,0),d = a de A 


1 1 
5. P = (0,0,0), d = | —1 | 6.P=(-3,1,2)d=|0 
4 5 


En los ejercicios 7 y 8, escriba la ecuación del plano que pasa 
por P con vector normal n en (a) forma normal y (b) forma 
general. 


3 1 
7. P = (0,1,0), n = | 2 8.P=(-3,1,2)n=|0 
1 5 


En los ejercicios 9 y 10, escriba la ecuación del plano que pasa 
por P con vectores directores u y v en (a) forma vectorial y 


(b) forma paramétrica. 
2 =3 
9.P=(0,0,0)u=|1|v=| 2 
2 1 
1 =1 
10.P=(4,-1,3)u=|1|v=| 1 
0 1 


En los ejercicios 11 y 12, proporcione la ecuación vectorial de 

la recta que pasa por P y Q. 

11. P = (1, -2), Q = (3,0) 

12. P = (4, —1, 3), Q = (2, 1,3) 

En los ejercicios 13 y 14, proporcione la ecuación vectorial del 
plano que pasa por P, Qy R. 

13. P = (1, 1, 1), Q = (4,0, 2), R = (0,1, —1) 

14. P = (1, 0, 0), Q = (0, 1,0), R = (0,0, 1) 

15. Encuentre las ecuaciones paramétricas y una ecuación 


en forma vectorial para las rectas en R? con las siguien- 
tes ecuaciones: 


(a) y=3x-1 (b) 3x + 2y =5 


16. Considere la ecuación vectorial x = p + t(q — p), 
donde p y q corresponden a distintos puntos P y Q en 
R? o RÌ. 

(a) Demuestre que esta ecuación describe el segmento 
de recta PQ cuando t varía de 0 a 1. 

(b) ¿Para cuál valor de t, x es el punto medio de PQ y 
cuál es x en este caso? 

(c) Encuentre el punto medio de PQ cuando P = (2, 
-3) yQ = (0,1). 

(d) Encuentre el punto medio de PQ cuando P = (1,0, 
1)y Q = (4,1, —2). 

(e) Encuentre los dos puntos que dividen PQ del inciso 
(c) en tres partes iguales. 

(£) Encuentre los dos puntos que dividen PQ del inciso 
(d) en tres partes iguales. 


17. Sugiera una “demostración vectorial” del hecho de que, 
en R?, dos rectas con pendientes m, y m, son perpendicu- 
lares si y sólo si m,m, = —1. 


18. La recta € pasa a través del punto P = (1, —1, 1) y tiene 
2 


3 |. Para cada uno de los 
=] 


vector director d = 


siguientes planos P, determine si € y P son paralelos, 
perpendiculares o ninguno de los dos. 

(a) 2x+3y—=z=1  (b) 4x—y+5z=0 

(c) x-y-z=3 (d) 4x + 6y — 2z=0 


19. El plano Y, tiene la ecuación 4x — y + 5z = 2. Para 
cada uno de los planos Y del ejercicio 18, determine si 
P, y P son paralelos, perpendiculares o ninguno de los 
dos. 


20. Encuentre la forma vectorial de la ecuación de la recta 
en R? que pasa a través de P = (2, — 1) y es perpendicu- 
lar a la recta con ecuación general 2x — 3y = 1. 


21. Encuentre la forma vectorial de la ecuación de la recta 
en R? que pasa a través de P = (2, —1) y es paralela a la 
recta con ecuación general 2x — 3y = 1. 


22. Encuentre la forma vectorial de la ecuación de la recta 
en R? que pasa a través de P = (—1, 0, 3) y es perpendi- 
cular al plano con ecuación general x — 3y + 2z = 5. 

23. Encuentre la forma vectorial de la ecuación de la recta 


en R? que pasa a través de P = (—1, 0, 3) y es paralela a 
la recta con ecuaciones paramétricas 


x= l- t 
y= 2+3t 
z= =2= E 


24. Encuentre la forma normal de la ecuación del plano que 
pasa por P = (0, —2, 5) y es paralelo al plano con ecua- 
ción general 6x — y + 2z = 3. 
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25. Un cubo tiene vértices en los ocho puntos (x, y, z), 

donde x, y y z son 0 o 1. (Vea la figura 1.34.) 

(a) Encuentre las ecuaciones generales de los planos 
que determinan las seis caras (lados) del cubo. 

(b) Encuentre la ecuación general del plano que con 
tiene la diagonal desde el origen hasta(1, 1, 1) y es 
perpendicular al plano xy. 

(c) Encuentre la ecuación general del plano que con- 
tiene las diagonales laterales a las que se refiere el 
ejemplo 1.22. 


26. Encuentre la ecuación del conjunto de todos los puntos 
que son equidistantes de los puntos P = (1, 0, —2) y 


Q = (5, 2, 4). 


En los ejercicios 27 y 28, encuentre la distancia desde el punto 
Q hasta la recta €. 


27. Q = (2,2), € con ecuación H = a + l il 


2 -1 
x 1 =2 
28. Q = (0, 1,0), € con ecuación | y| =|1|++| 0 
z 1 3 


En los ejercicios 29 y 30, encuentre la distancia desde el punto 
Q hasta el plano P. 


29. Q = (2, 2, 2), P con ecuación x + y — z = 0 
30. Q = (0, 0, 0), P con ecuación x — 2y + 2z = 1 


La figura 1.66 sugiere una forma de usar vectores para lo- 

calizar el punto R sobre € que está más cerca de Q. 

31. Encuentre el punto R sobre € que esté más cerca de Q en 
el ejercicio 27. 

32. Encuentre el punto R sobre € que esté más cerca de Q en 
el ejercicio 28. 


Q 
£ 
R 
P 
r 
p 

"O 
Figura 1.66 __ 
r =p + PR 
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La figura 1.67 sugiere una forma de usar vectores para lo- 
calizar el punto R sobre P que esté más cerca de Q. 


Figura 1.67 
r=p>+ PQ + QR 


33. Encuentre el punto R sobre P que esté más cerca de Q 
en el ejercicio 29. 


34. Encuentre el punto R sobre P que esté más cerca de Q 
en el ejercicio 30. 


En los ejercicios 35 y 36, encuentre la distancia entre las rectas 
paralelas. 


> 0-00 


x 1 1 x 0 1 
36.|y|= Os 1] y [$|(S[1 [21 
Z =1 1 Z 1 1 


En los ejercicios 37 y 38, encuentre la distancia entre los 
planos paralelos. 


37.2x+y=22=0 y 2x+y=22=5 
38.x+y+z=1 


39. Demuestre la ecuación (3) de la página 43. 


y x+y+z=3 


40. Demuestre la ecuación (4) de la página 44. 


41. Demuestre que, en R?, la distancia entre rectas paralelas 
con ecuaciones n- x= Cc, y n° x = c, está dada por 
la = cal 
[in 
42. Demuestre que la distancia entre planos paralelos con 
ecuaciones n° x = d, y n» x = d, está dada por 
ld, T d| 


[in] 


Si dos planos no paralelos P, y P, tienen vectores normales n, 


y n, y 0 es el ángulo entre n; y n, entonces se define el ángulo 


entre P, y P, como 8 o como 180° — 6, cualquiera que sea un 


ángulo agudo. (Figura 1.68) 


180° —6 


Figura 1.68 


En los ejercicios 43-44, encuentre el ángulo agudo entre los 
planos con las ecuaciones dadas. 


43.x+y+z=0 y 2x+y-2z=0 
44.3x=y+2z2=5 y x+4y=z=2 


En los ejercicios 45-46, demuestre que el plano y la recta con 
las ecuaciones dadas se intersectan, y luego encuentre el án- 
gulo agudo de intersección entre ellos. 


45. El plano dado por x + y + 2z = 0 y la recta dada por 
x=23+ t 
y=1=2t 
z=3+ t 

46. El plano dado por 4x — y — z = 6 y la recta dada por 


x=t 
y= 1 2t 
z=2+3t 


Los ejercicios 47-48 exploran un planteamiento para el pro- 
blema de encontrar la proyección de un vector sobre un plano. 
Como muestra la figura 1.69, si P es un plano a través del ori- 
gen en R? con vector normal n, y v es un vector en R?, enton- 
ces p = proyy(v) es un vector en P tal que v — cn = p para 
algún escalar c. 


Figura 1.69 


Proyección sobre un plano 


47. Con el hecho de que n es ortogonal a todo vector en P 
(y por tanto a p), calcule c y en consecuencia encuentre 
una expresión para p en términos de v y n. 


48. Use el método del ejercicio 43 para encontrar la proyec- 
ción de 


Sección 1.3 Rectas y planos 


sobre los planos con las siguientes ecuaciones: 


(a) x+y+z=0 
(c) x-2z2=0 


(b) 3x—=y+z=0 
(d) 2x— 3y+z=0 
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El producto cruz 


Sería conveniente que se pudiera convertir fácilmente la forma vectorial x = p + su + 
tv de la ecuación de un plano a la forma normal n: x = n p. Lo que se necesita es un 
proceso que, dados dos vectores no paralelos u y v, produzca un tercer vector n que sea 
ortogonal tanto a u como a v. Un método es usar una construcción conocida como pro- 
ducto cruz de vectores. Sólo válido en R?, se define del modo siguiente: 


uy vı 
Definición El producto cruz de u = | u | y v = | v | es el vector u X v 
definido por u va 
U,V3 — UzV, 
u X v= | UV — Uv; 
UV, — UV] 


A continuación se ilustra un atajo que puede ayudarle a recordar cómo calcular el pro- 
ducto cruz de dos vectores. Abajo de cada vector completo escriba sus primeros dos com- 
ponentes. Ignore los dos componentes en la línea superior y considere cada bloque de cua- 
tro: reste los productos de los componentes conectados con líneas discontinuas, de los 
productos de los componentes conectados con líneas sólidas. (Es útil notar que el primer 
componente de u X v no tiene números 1 como subíndices, el segundo no tiene 2 y el ter- 
cero no tiene 3.) 


Vi UV — WV 


> Vaz UV, — UV, 


Uy Va UV, — UV; 


uxyv 


u 


Figura 1.70 


Figura 1.71 


— 


pp 


A 


vi 


mm 


o N 


Los siguientes problemas exploran brevemente el producto cruz. 


. Calcule u X v. 


0 3 5) 0 
(AA AA A El (b) u=|-1|,v= 
1 2 2 1 
=il 2 1 1 
(c) u = 2|v=|-4 (d u=|1|v=|2 
3 =6 1 3 


Demuestre que e, X e, = e,,€, X e; = e y € X € = 6. 


. Con la definición de producto cruz, demuestre que u X v (como se muestra en la 


figura 1.70) es ortogonal a u y v. 


. Use el producto cruz como ayuda para encontrar la forma normal de la ecuación 


del plano. 
0 3 
(a) El plano que pasa por P = (1, 0, —2), paralelo au = | 1|yv=|-—1 
1 2 


(b) El plano que pasa por P = (0, —1,1),Q = (2,0,2) yR = (1,2, —1) 


. Demuestre las siguientes propiedades del producto cruz: 


(a) vxu=-—(uXxv) (bux0=0 
(c) uxu=0 (d) u X kv = k(u X v) 
(e) uxku=0 (1) ux(v+w=uXv+uxXxw 


. Demuestre las siguientes propiedades del producto cruz: 


(a) u- (v X w) = (u X v)-w (b) u x (v X w) = (u-w)v — (u-v)w 


(©) [u xv? = Jullvi?— (uv) 


. Vuelva a trabajar los problemas 2 y 3, esta vez usando los problemas 5 y 6. 


. Sean u y v vectores en R? y sea 0 el ángulo entre u y v. 


(a) Demuestre que |u X v|| = |ulll|v]| sen 6. [Sugerencia: use el problema 6(c).] 
(b) Demuestre que el área A del triángulo determinado por u y v (como se mues- 
tra en la figura 1.71) está dada por 


A = lu x vl 


(c) Use el resultado del inciso (b) para calcular el área del triángulo con vértices 
A = (1,2,1)B= (2, 1,0) y C = (5, —1,3). 
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La fuerza se define como el pro- 
ducto de masa por aceleración de- 
bida a la gravedad (que, en la Tie- 
rra, es de 9.8 m/s?). Por tanto, una 
masa de 1 kg ejerce una fuerza des- 
cendente de 1 kg X 9.8 m/s? o 9.8 
kg-m/s”. Esta unidad de medición 
es un newton (N). De este modo, 
la fuerza ejercida por una masa de 
1 kg es 9.8 N. 


Figura 1.72 


La resultante de dos fuerzas 


Aplicaciones 


Los vectores pueden usarse para modelar fuerzas. Por ejemplo, un viento que sopla a 
30 km/h en dirección hacia el oeste o la gravedad de la Tierra que actúa sobre una masa 
de 1 kg con una fuerza de 9.8 newtons hacia abajo se representan mejor mediante vecto- 
res, pues cada uno consiste de una magnitud y una dirección. 

Con frecuencia, múltiples fuerzas actúan sobre un objeto. En tales situaciones, el re- 
sultado neto de todas las fuerzas que actúan en conjunto es una sola fuerza llamada re- 
sultante, que es simplemente la suma vectorial de las fuerzas individuales (figura 1.72). 
Cuando varias fuerzas actúan sobre un objeto, es posible que la fuerza resultante sea 
cero. En este caso, el objeto claramente no se mueve en alguna dirección y se dice que está 
en equilibrio. Cuando un objeto está en equilibrio y los vectores fuerza que actúan sobre 
él se ordenan de origen a cola, el resultado es un polígono cerrado (figura 1.73). 


Figura 1.73 
Equilibrio 


Ejemplo 1.34 


= 
Ann y Bert tratan de rodar una piedra por el camino. Ann empuja con una fuerza de 
20 N en dirección hacia el norte, mientras que Bert empuja con una fuerza de 40 N en 
dirección al este. 


(a) ¿Cuál es la fuerza resultante sobre la piedra? 
(b) Carla trata de evitar que Ann y Bert muevan la piedra. ¿Qué fuerza debe aplicar Carla 
para mantener la piedra en equilibrio? 


Solución (a) La figura 1.74 muestra la posición de las dos fuerzas. Con la regla del para- 
lelogramo, sume las dos fuerzas para obtener la resultante r como se muestra. Por el teo- 


Figura 1.74 


La resultante de dos fuerzas 
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rema de Pitágoras, se ve que ||r|| = W20? + 40? = 2000 = 44.72 N. Para la dirección 

de r, calcule el ángulo 0 entre r y la fuerza hacia el este de Bert. Se encuentra que 

sen 0 =20/|r|| = 0.447, de modo que 0 = 26.57° 

(b) Si denota las fuerzas ejercidas por Ann, Bert y Carla como a, b y c, respectivamente, 
entonces se requiere que a + b + c = 0. Por tanto, c = —(a + b) = —r, de modo 
que Carla debe ejercer una fuerza de 44.72 N en la dirección opuesta a r. A 


Con frecuencia, se está interesado en la descomposición de un vector fuerza en otros vec- 
tores cuya resultante es el vector dado. Este proceso se conoce como descomposición de 
un vector en componentes. En dos dimensiones, se quiere descomponer un vector en dos 
componentes. Sin embargo, existen infinitas formas de hacerlo; la más útil será descom- 
poner el vector en dos componentes ortogonales. (Los capítulos 5 y 7 exploran esta idea 
con más generalidad.) Por lo general, esto se hace al introducir ejes coordenados y elegir 
los componentes de modo que uno sea paralelo al eje x y el otro al eje y. Comúnmente, 
a dichos componentes se les conoce como componentes horizontal y vertical, respecti- 
vamente. En la figura 1.75, f es el vector dado y f, y f, son sus componentes horizontal y 


vertical. 
Figura 1.75 
Descomposición de un vector en componentes 
| > 
Ejemplo 1.35 Ann jala el manubrio de un carro con una fuerza de 100 N. Si el manubrio forma un án- 


gulo de 20° con la horizontal, ¿cuál es la fuerza que tiende a jalar al carro hacia adelante 
y cuál fuerza tiende a levantarlo del suelo? 


Solución La figura 1.76 muestra la situación y el diagrama vectorial que necesita con- 
siderar. 


Figura 1.76 
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Se ve que 
I£ = [£l cos20° y |£,| = ||f|| sen20* 


Por tanto, ||f,|| = 100(0.9397) = 93.97 y [£, || = 100(0.3420) = 34.20. De modo que el 
carro se jala hacia adelante con una fuerza de aproximadamente 93.97 N y tiende a ele- 
varse del suelo con una fuerza de aproximadamente 34.20 N. f 


El siguiente ejemplo se resuelve usando dos métodos diferentes. La primera solución 
considera un triángulo de fuerzas en equilibrio; la segunda solución usa descomposición 
de fuerzas en componentes. 


Ejemplo 1.36 La figura 1.77 muestra una pintura que cuelga del techo mediante dos alambres. Si la 
pintura tiene una masa de 5 kg y si los dos cables forman ángulos de 45 y 60 grados con 
el techo, determine la tensión en cada cable. 


Figura 1.77 


Solución 1 Suponga que la pintura está en equilibrio. entonces los dos cables deben 
proporcionar suficiente fuerza ascendente para equilibrar la fuerza descendente de la 
gravedad. La gravedad ejerce una fuerza descendente de 5 X 9.8 = 49 N sobre la pintura, 
de modo que los dos cables deben jalar conjuntamente hacia arriba con 49 N de fuerza. 
Sean f, y f, las tensiones en los cables y sea r su resultante (figura 1.78). Se sigue que 
|r| = 49, pues está en equilibrio. 
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Al usar la ley de los senos, se tiene 


f > 
e ll NEL 
sen45%  sen30% sen 105° 
Ras” 
Ao. de modo que 
reia Ilel| sen 45° 49(0.7071) lesen 302 49(0.5) 
lfl] = = = 35.87 y [[£l| = = = 25.36 
P sen 105° 0.9659 sen 105° 0.9659 
1 
Por tanto, las tensiones en los cables son aproximadamente 35.8 N y 25.36 N. 
ao Solución 2 Descomponga f, y f, en componentes horizontales y verticales, por decir, 
fi =h, + v, yf = h, + v, y note que, como arriba, hay una fuerza descendente de 49 N 
(figura 1.79). 
Figura 1.78 Se sigue que 
[Al v3Hf,l 
3 , [hili = [fillos 60° = 25, il] = Ifi] sen 60° = 23%, 
l£ o — lfl 
[hal = [£ cos 45° = 5 Iml = NE] sen 45" = 7 
Va f Dado que la pintura está en equilibrio, los componentes horizontales deben equilibrarse, 
al igual que los componentes verticales. Por tanto, [[h,]| = [[h,l| y llv,I| + [v,| = 49, de donde 
se concluye que 
60° 45° 
21, valg l£ 
h h fll = == = y2]f A = 49 
: ! A y 


Al sustituir la primera de estas ecuaciones en la segunda ecuación se obtiene 


VEL, 16 _ 
v2 ë v2 


49⁄2 
49, Ll == = 25.36 
o l= 5 


Por tanto, |f| = vV2llĖ|| = 1.4142(25.36) = 35.87, de modo que las tensiones en los 
49 N cables son aproximadamente 35.87 N y 25.36 N, como antes. 


naura 13 -l 


A lo largo de la historia, la gente ha transmitido información usando códigos. En oca- 
siones la intención es disfrazar el mensaje a enviar, como cuando cada letra en una pala- 
bra se sustituye con otra diferente de acuerdo con una regla de sustitución. Aunque fas- 
cinantes, dichos códigos secretos, o cifrados, no se tratarán aquí; pues son el objetivo del 
campo de la criptografía. En vez de ello, el texto se concentrará en los códigos que se usan 
cuando deben transmitirse datos de manera electrónica. 

Un ejemplo familiar de tal código es el código Morse, con su sistema de puntos y 
rayas. La llegada de las computadoras digitales en el siglo XX condujo a la necesidad de 
transmitir grandes cantidades de datos rápidamente y con exactitud. Las computadoras 
se diseñaron para codificar datos como secuencias de números 0 y 1. Muchos avances 
tecnológicos recientes dependen de códigos y se les encuentra todos los días sin estar al 
tanto de ellos: comunicaciones satelitales, reproductores de discos compactos, los códi- 
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La moderna teoría de códigos se ori- 
ginó con el trabajo del matemático y 
científico de la computación, el esta- 
dounidense Claude Shannon (1916— 
2001), cuya tesis de 1937 mostró 
cómo el álgebra podía desempeñar 
un papel en el diseño y análisis de 
los circuitos eléctricos. Tiempo des- 
pués, Shannon sería útil en la for- 
mación del campo de la teoría de la 
información y propondría las bases 
teóricas de lo que ahora se conoce 
como códigos de corrección de 
error. 


gos universales de producto (UPC) asociados con los códigos de barras que se encuentran 
en las mercancías y los números internacionales normalizados de los libros (ISBN) que se 
encuentran en todo libro publicado en la actualidad, son sólo algunos ejemplos. 

En esta sección se usarán vectores para diseñar códigos que detecten errores que pue- 
den ocurrir en la transmisión de datos. En capítulos posteriores se construirán códigos que 
pueden no sólo detectar, sino también corregir errores. Los vectores que surgen en el estu- 
dio de los códigos no son vectores en R”, sino en Z3 o, de manera más general, Z”. La pri- 
mera vez que se encontraron tales vectores fue en la sección 1.1. Dado que las computado- 
ras representan los datos en términos de O y 1 (que pueden interpretarse como 
encendido/apagado, cerrado/abierto, falso/verdadero o no/sí), comience por considerar 
códigos binarios, que consisten de vectores con entradas en Z,. 

En la práctica, se tiene un mensaje (que consiste de palabras, números o símbolos) que 
se quiere transmitir. Comience por codificar cada “palabra” del mensaje como un vector 


binario. 


Definición Un código binario es un conjunto de vectores binarios (de la misma 
longitud) llamados vectores código. El proceso de convertir un mensaje en vectores 
código se llama codificación, y el proceso inverso se llama decodificación. 


Como verá, es enormemente deseable que un código también tenga otras propieda- 
des, como la capacidad de detenerse cuando ocurra un error en la transmisión de un 
vector código y, si es posible, sugerir cómo corregir el error. 

Suponga que ya se codificó un mensaje como un conjunto de vectores código bina- 
rio. Ahora se quiere enviar los vectores código binario a través de un canal (como un 
transmisor de radio, una línea telefónica, un cable de fibra óptica o un CD láser). Por 
desgracia, el canal puede ser “ruidoso” (debido a interferencia eléctrica, señales compe- 
tidoras, o polvo y rayones). Como resultado, pueden introducirse errores: algunos de los 
0 pueden cambiar por 1 y viceversa. ¿Cómo puede protegerse contra este problema? 


Ejemplo 1.37 


> 
Se quiere codificar y transmitir un mensaje que consiste de una de las palabras arriba, 
abajo, izquierda o derecha. Se decide usar los cuatro vectores en Z} como el código bina- 
rio, como se muestra en la tabla 1.4. 

Si el receptor también tiene esta tabla y el mensaje codificado se transmite sin error, la 
decodificación es trivial. Sin embargo, suponga que ocurrió un solo error. (Por error se en- 
tiende que cambió un componente del vector código.) Por ejemplo, suponga que se envía 
el mensaje “abajo” codificado como [0, 1], pero ocurre un error en la transmisión del pri- 
mer componente y el 0 cambió por 1. Entonces el receptor vería [1, 1] en su lugar y deco- 
dificaría el mensaje como “derecha”. (Sólo debe preocuparse por el caso de errores indivi- 
duales como éste. En la práctica, por lo general se supone que la probabilidad de múltiples 
errores es despreciablemente pequeña.) Incluso si el receptor supiera (de alguna manera) 
que ocurrió un solo error, no sabría si el vector código correcto era [0, 1] o [1, 0]. 


Tabla 1.4 


Mensaje arriba abajo izquierda derecha 


Código [0, 0] [0, 1] [1,0] [1,1] 
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Pero suponga que se envía el mensaje usando un código que fuese un subconjunto de Z4 
en otras palabras, un código binario de longitud 3, como se muestra en la tabla 1.5 


Tabla 1.5 
Mensaje arriba abajo izquierda derecha 
Código [0, 0, 0] [0, 1,1] [1,0, 1] [1,1,0] 


Este código puede detectar cualquier error individual. Por ejemplo, si se envió 
“abajo” como [1, 1, 1] y ocurrió un error en un componente, el receptor leería [1, 1, 1], 
[0, 0, 1] o [0, 1, 0], ninguno de los cuales es un vector de código. De modo que el recep- 
tor sabría que ocurrió un error (mas no dónde) y podría pedir la retransmisión del men- 
»—> saje codificado. (¿Por qué el receptor no sabría dónde estuvo el error?) a 


El término paridad proviene de la 
palabra latina par, que significa 
“igual”. Se dice que dos enteros tie- 
nen la misma paridad si ambos 
son pares o ambos son impares. 


El código en la tabla 1.5 es un ejemplo de un código de detección de error. Hasta la 
década de 1940, esto era lo mejor que podía lograrse. La llegada de las computadoras di- 
gitales condujo al desarrollo de códigos que podían corregir, así como detectar errores. 
Éstos se considerarán en los capítulos 3, 6 y 7. 

El mismo mensaje a transmitir puede consistir de vectores binarios. En este caso, un 
simple pero útil código de detección de errores es un código de control de paridad, que 
se crea al agregar un componente adicional, llamado dígito de control, a cada vector, de 
modo que la paridad (el número total de números 1) sea par. 


| > 
Ejemplo 1.38 Si el mensaje por enviar es el vector binario [1, 0, 0, 1, 0, 1], que tiene una cantidad impar 
de números 1, entonces el dígito de control será 1 (para hacer que el número total de 1 
en el vector código sea par) y el vector código será [1, 0, 0, 1,0, 1,1]. 
Note que se detectará un solo error, pues ello causará que la paridad del vector có- 
digo cambie de par a impar. Por ejemplo, si ocurriera un error en el tercer componente, 
el vector código se recibiría como [1, 0, 1, 1, 0, 1, 1], cuya paridad es impar porque tiene 


cinco números 1. 


Observe este concepto de manera un poco más formal. Suponga que el mensaje es el 
vector binario b = [b,, b,,...,b,] en Z3. Entonces el vector código de control de pari- 
dad es v = [b,, b», . . . , b, d] en Z5*”*, donde el dígito de control d se elige de modo que 


bi +b, +: +b,+d=0enZ, 
o, de manera equivalente, de modo que 
l.v=0 


donde 1 = [1,1,..., 1], un vector cuyos componentes son todos los números 1. El vec- 
tor 1 se llama vector de control. Si el vector v' se recibe y 1 + v’ = 1, entonces puede estar 
seguro de que ocurrió un error. (Aunque no se considera la posibilidad de más de un 
error, observe que este esquema no detectará un número par de errores.) 

Los códigos de control de paridad son un caso especial de los más generales códigos de 
dígito de control, que se considerarán después de extender primero las ideas precedentes a 
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escenarios más generales. Los códigos que usan vectores m-arios se llaman códigos 
m-arios. El siguiente ejemplo es una extensión directa del ejemplo 1.39 a códigos ternarios. 


> 
Ejemplo 1.39 Sea b = [b,,b,,...,b,] un vector en Z5. Entonces, un vector código de dígito de control 
puede definirse mediante v = [b,, b,, ...,b,, d] (en Z;**),con el dígito de control d 
elegido de modo que 
l.v=0 
(donde el vector de control 1 = [1, 1,..., 1] es el vector de números 1 en Z7*'); esto es, 


el dígito de control satisface 


b,+b,+:"+b,+d=0enZ; 


Por ejemplo, considere el vector u = [2, 2, 0, 1, 2]. La suma de sus componentes es 
2+2+0+1+2= l, de modo que el dígito de control debe ser 2 (pues 1 + 2 = 0). 
En consecuencia, el vector código asociado es v = [2, 2, 0, 1, 2, 2]. | 


Aunque los códigos de dígito de control simples detectarán errores individuales, con 
frecuencia también es importante detectar otros tipos comunes de errores, como el in- 
tercambio accidental, o transposición, de dos componentes adyacentes. (Por ejemplo, la 
transposición del segundo y tercero componentes de v en el ejemplo 1.39 resultaría en el 
vector incorrecto v’ = [2, 0, 2, 1, 2, 2].) Para tales propósitos, se diseñaron otros tipos de 
códigos de dígitos de control. Muchos de ellos simplemente sustituyen el vector de con- 
trol 1 por algún otro vector c cuidadosamente elegido. 


> 


Ejemplo 1.40 


O "74927 02094 
Figura 1.80 


Un código universal de producto 


6 


El código universal de producto, o UPC (figura 1.80), es un código asociado con los 
códigos de barra que se encuentran en muchos tipos de mercancía. 

Las barras negras y blancas que se escanean con un láser en un mostrador de verifi- 
cación en una tienda, corresponden a un vector 10-ario u = [u,, 4), ..., U1 d] de longi- 
tud 12. Los primeros 11 componentes forman un vector en Zig que dan la información 
del fabricante y el producto; el último componente d es un dígito de control elegido de 
modo que c- u = 0 en Zio donde el vector de control c es [3, 1, 3, 1, 3, 1, 3, 1,3, 1, 3, 1]. 
Esto es, después de reordenar, 


3(u, + u + us + u, + Uy + u) + (u + u, + us + ug + up) +d=0 


donde d es el dígito de control. En otras palabras, el dígito de control se elige de modo 
que el lado izquierdo de esta expresión sea un múltiplo de 10. 
Para el UPC que se muestra en la figura 1.80, puede determinar que el dígito de con- 
trol es 6, y realizar todos los cálculos en Z4: 
cc u=3:0+7+3:4+9+3:24+7+3-04+2+3:0+9+3:+4+d 
=3(0+4+2+0+0+4)+(7+9+7+2+9) +4 
=3(0) +4+d 
=4+d 
El dígito de control d debe ser 6 para que el resultado del cálculo sea 0 en Z,. 


(Otra forma de considerar el dígito de control en este ejemplo es que se elija de 
modo que c+ u sea un múltiplo de 10.) 
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El código universal de producto detectará todos los errores individuales y la mayoría 
de los errores de transposición en componentes adyacentes. Para ver este último punto, 
suponga que el UPC en el ejemplo 1.40 se escribió de manera incorrecta como u’ = [0, 
7, 4, 2, 9, 7, 0, 2, 0, 9, 4, 6], con el cuarto y quinto componentes transpuestos. Cuando se 

M==> aplica el vector de control, se tendría cu” = 4% 0 (¡verifíquelo!), lo que alerta del hecho 
de que hubo un error. (Vea los ejercicios 29 y 30.) 


| > 


Ejemplo 1.41 El código de número internacional normalizado de libros de 10 dígitos (ISBN-10) es 
otro código de dígito de control muy utilizado. Está diseñado para detectar más tipos de 
errores que el código universal de productos y, en consecuencia, es ligeramente más 
complicado. Aunque el principio básico es el mismo. 

El vector código es un vector en Z;). Los primeros nueve componentes proporcionan 
el país, editor e información del libro; el décimo componente es el dígito de control. Su- 
ponga que el ISBN-10 de un libro es 0-534-34450-X. Se registra como el vector 


b = [0, 5,3, 4,3, 4, 4, 5, 0, X] 


donde el “dígito” de control es la letra X. 

Para el código ISBN-10, el vector de control es c = [10, 9, 8, 7, 6, 5, 4, 3, 2, 1], y se re- 
quiere que c + b = 0 en Z,,. Determine el dígito de control para el vector b en este ejem- 
plo. Debe calcular 


c-b =10-0+9:5+8:3+7:+4+6:3+5+4+4+4+3:5+2-0+d 


donde d es el dígito de control. Comience por realizar todas las multiplicaciones en Z;. 
(Por ejemplo, 9 - 5 = 1, pues 45 es 1 más que el menor múltiplo más cercano de 11, a saber, 
44. En un reloj de 11 horas, las 45 en punto es 1 en punto.) La suma simplificada es 


O0+1+2+6+7+9+5+4+F0+d 


y al sumar en Z,, se obtiene 1 + d. El dígito de control d debe elegirse ahora de modo que 
el resultado final sea 0; por tanto, en Z,,,d = 10. (De manera equivalente, d debe elegirse 
de modo que c+ b será un múltiplo de 11.) Pero, dado que es preferible que cada com- 
ponente de un ISBN-10 sea un solo dígito, el numeral romano X se usa para 10 siempre 
que funcione como dígito de control, como sucede aquí. A 


El código ISBN detectará todos los errores individuales y errores de transposición 
adyacente (vea los ejercicios 33-35). 


Comentario El código ISBN-10 se usa desde 1970. Sin embargo, desde 2007, la ma- 
yoría de los libros también se identifican con un código ISBN de 13 dígitos. Este dígito 
ISBN-13 es compatible con el código EAN-13 (número de artículo europeo de 13 dígi- 
tos) y usa un esquema de dígito de control similar al UPC. De manera específica, un 
código ISBN-13 es un vector en Z} donde el último dígito es el dígito de control y el vec- 
tor de control es [1,3, 1, 3,. . 3, 1] en Zi. Como su primo UPC, el código ISBN-13 detec- 
tará todos los errores individuales, mas no todos los errores de transposición adyacentes. 


'Horclclos 1.4 


Vectores fuerza 2. f, actúa hacia el oeste con una magnitud de 15 N y £, 
actúa hacia el sur con una magnitud de 20 N 


En los ejercicios 1-6, determine la resultante de las fuerzas dadas. ) f , n 
3. f, actúa con una magnitud de 8 N y f, actúa a un ángulo 


1. f, actúa hacia el norte con una magnitud de 12 N y f, de 60° con respecto a f, con una magnitud de 8 N 


actúa hacia el este con una magnitud de 5 N 
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4. f, actúa con una magnitud de 4 N y f, actúa a un ángulo 
de 135° con respecto a f, con una magnitud de 6 N 


5. f, actúa hacia el este con una magnitud de 2 N, f, actúa 
hacia el oeste con una magnitud de 6 N y f; actúa a un 
ángulo de 60° con respecto a f, con una magnitud de 
4N 


6. f, actúa hacia el este con una magnitud de 10 N, f, actúa 
hacia el norte con una magnitud de 13 N, f, actúa hacia 
el oeste con una magnitud de 5 N y f, actúa hacia el sur 
con una magnitud de 8 N 


7. Descomponga una fuerza de 10 N en dos fuerzas mu- 
tuamente perpendiculares, de modo que un compo- 
nente forme un ángulo de 60° con la fuerza de 10 N. 


8. Un bloque de 10 kg se encuentra sobre una rampa que 
está inclinada a un ángulo de 30° (figura 1.81). Si 
supone que no hay fricción, ¿qué fuerza, paralela a la 
rampa, debe aplicarse para evitar que el bloque se 
deslice por la rampa? 


10 kg 
30° 
Figura 1.81 


9. Una grúa levanta un automóvil. La tensión en el cable 
de la grúa es 1500 N y el cable forma un ángulo de 45° 
con la horizontal, como se muestra en la figura 1.82. 
¿Cuál es la fuerza vertical que tiende a levantar al au- 
tomóvil del suelo? 


f=1500 N 


Figura 1.82 


10. Una podadora tiene una masa de 30 kg. Se le empuja 
con una fuerza de 100 N. Si el manubrio de la podadora 
forma un ángulo de 45° con el suelo, ¿cuál es el compo- 
nente horizontal de la fuerza que hace que la podadora 
se mueva hacia adelante? 


11. Un letrero que cuelga afuera del restaurante de Joe tiene 
una masa de 50 kg (figura 1.83). Si el cable que lo so- 
porta forma un ángulo de 60° con el muro del edificio, 
determine la tensión en el cable. 


RESTAURANTE DE JOE 


Figura 1.83 


12. Un letrero que cuelga en la ventana del restaurante de 
Joe tiene una masa de 1 kg. Si las cuerdas que lo 
sostienen forman cada una un ángulo de 45° con el le- 
trero y los ganchos que las sostienen están a la misma 
altura (figura 1.84), encuentre la tensión en cada cuerda. 
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Figura 1.84 


13. Una pintura, con una masa de 15 kg, está suspendida 
mediante dos cables de unos ganchos en el techo. Si los 
cables tienen longitudes de 15 cm y 20 cm, y la distancia 
entre los ganchos es 25 cm, encuentre la tensión en cada 
cable. 


14. Una pintura, con una masa de 20 kg, está suspendida 
mediante dos cables de un techo. Si los cables forman 
ángulos de 30° y 45° con el techo, encuentre la tensión 
en cada cable. 


Vectores código 

En los ejercicios 15 y 16, encuentre el vector código de control 
de paridad para el vector binario u. 

15. u = [1,0,1,1] 16. u = [1, 1,0,1, 1] 


En los ejercicios 17-29, se proporciona un vector código de con- 
trol de paridad v. Determine si en la transmisión de v ocurrió 
un error individual. 


17.v = [i 0, l, 0] 
19. v = [0, l, 0, 1, 1, 1] 


18. v = [1, 1,1,0, 1, 1] 
20. v = [1, 1,0,1,0, 1,1,1] 


Los ejercicios 21-24 se refieren a códigos de dígito de control en 
los que el vector de control es c = [1, 1,..., 1] de la longitud 
adecuada. En cada caso, encuentre el dígito de control d que se 
agregaría al vector u. 


21. u = [1,2,2,2] en Z5 22. u = [3, 4, 2, 3] en Z4 
23. u = [1,5,6,4,5] en ZZ 24. u = [3,0,7, 5,6,8] en Z$ 


25. Demuestre que, para cualesquiera enteros positivos m y 
n, el código de dígito de control en Z”,, con vector de 
control c = 1 = [1,1,..., 1], detectará todos los errores 
individuales. (Esto es: demuestre que, si los vectores u y 
v en Z;, difieren en exactamente una entrada, entonces 
c:u + cev.) 


En los ejercicios 26 y 27, encuentre el dígito de control d en el 
código universal de producto dado. 


26. [0, 5, 9, 4, 6, 4,7, 0, 0, 2,7, d] 
27. [0, 1, 4,0, 1, 4, 1, 8, 4, 1, 2, d] 
28. Considere el UPC [0, 4, 6, 9, 5, 6, 1, 8, 2, 0, 1, 5]. 
(a) Demuestre que este UPC no puede ser correcto. 
(b) Si supone que se cometió un error individual y que 
el dígito incorrecto es el 6 en la tercera entrada, en- 
cuentre el UPC correcto. 


29. Demuestre que el código universal de producto detec- 

tará todos los errores individuales. 

30. (a) Pruebe que si se comete un error de transposición 
en la segunda y tercera entradas del UPC [0, 7, 4, 9, 
2,7,0,2,0, 9, 4, 6], se detectará el error. 

(b) Demuestre que existe una transposición que involu- 
cra dos entradas adyacentes del UPC en el inciso (a) 
que no se detectaría. 
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(c) En general, ¿en qué caso el código universal de pro- 
ductos no detectará un error de transposición que 
involucre dos entradas adyacentes? 


En los ejercicios 31 y 32, encuentre el dígito de control d en el 
número internacional normalizado de libros (ISBN-10). 


30. [0, 3, 8,7,9, 7,9,9, 3, d] 

31. [0, 3,9, 4, 7, 5, 6, 8, 2, d] 

32. Considere el ISBN-10 [0, 4, 4, 9, 5, 0, 8, 3, 5, 6]. 
(a) Demuestre que este ISBN-10 no puede ser correcto. 
(b) Si supone que se cometió un error individual y que 


el dígito incorrecto es el 5 en la quinta entrada, en- 
cuentre el ISBN-10 correcto. 


34. (a) Pruebe que si se cometió un error de transposición 

en la cuarta y quinta entradas del ISBN-10 [0, 6, 7, 
9,7, 6, 2, 9, 0, 6] se detectará el error. 

(b) Pruebe que si se cometió un error de transposición 
en cualesquiera dos entradas adyacentes del ISBN- 
10 del inciso (a) el error se detectará. 

(c) Pruebe, en general, que el código ISBN-10 siempre 
detectará un error de transposición que involucre 
dos entradas adyacentes. 


35. Considere el ISBN-10 [0, 8, 3,7, 0, 9, 9, 0, 2, 6]. 

(a) Demuestre que este ISBN-10 no puede ser correcto. 

(b) Si supone que el error fue una transposición que in- 
volucra dos entradas adyacentes, encuentre el ISBN- 
10 correcto. 

(c) Proporcione un ejemplo de un ISBN-10 para el cual 
se detectará un error de transposición que involucre 
dos entradas adyacentes, pero no será corregible. 


Toda tarjeta de crédito y débito tiene una identificación única mediante un número de 16 
dígitos que representa un código de dígito de control. Como en los ejemplos de esta sec- 
ción, los primeros 15 dígitos los asigna el banco emisor de la tarjeta, mientras que el último 
es un dígito de control determinado por una fórmula que usa aritmética modular. 

Todos los grandes bancos usan un sistema llamado Codabar para asignar el dígito de 
control. Es una ligera variación sobre el método del código universal de producto y se 
basa en un algoritmo diseñado por el científico de cómputo de IBM, Hans Peter Luhn en 
la década de 1950. 


Suponga que los primeros 15 dígitos de su tarjeta son 
5412 3456 7890 432 
y que el dígito de control es d. Esto corresponde al vector 
x = [5, 4, 1, 2, 3, 4, 5,6, 7, 8, 9, 0, 4, 3, 2, d] 


en Z!$. El sistema Codabar usa el vector de control c = [2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 
2, 1], pero en lugar de requerir que c - x = 0 en Zip se agrega un cálculo adicional para 
aumentar la capacidad de detección de error del código. Sea h el conteo del número de 
dígitos en posiciones impares que son mayores que 4. En este ejemplo, dichos dígitos son 
5,5,7 y 9, de modo que h = 4. 

Ahora se requiere que c - x + h = 0 en Zo. Por tanto, en el ejemplo se tiene, al reor- 
denar y trabajar módulo 10, 


cex+th=(2:-5+4+2:-1+2+2.-3+4+2.-5+6+2:7+8+2.-9 
+0+2:-4+3+2:-2+d)+4 


=2(5+1+3+5+7+9+4+2)+(4+2+4+6+8+0 
+3+d)+4 

=2 (6) +7+d+4 

=3+d 


En consecuencia, el dígito de control d para esta tarjeta debe ser 7, de modo que el resul- 
tado del cálculo es 0 en Zo 

El sistema Codabar es uno de los métodos más eficientes de detección de error. De- 
tectará todos los errores de dígito individual y la mayoría de otros errores comunes, 
como los de transposición adyacente. 
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ángulo entre vectores, 24 
combinación lineal de vectores, 12 
desigualdad de Cauchy-Schwarz, 22 
desigualdad del triángulo, 22 
distancia entre vectores, 23 

ecuación de un plano, 38-39 
ecuación de una recta, 36 

enteros módulo m (Z,,), 14-16 
longitud (norma) de un vector, 20 
multiplicación escalar, 7 


producto cruz, 48 

producto punto, 18 

propiedades algebraicas de los 
vectores, 10 

proyección de un vector sobre un 
vector, 27 

regla del paralelogramo, 6 

regla origen a punta, 6 

suma de vectores, 5 

teorema de Pitágoras, 26 


vector, 3 

vector binario, 13 

vector cero, 4 

vector director, 35 

vector m-ario, 16 

vector normal, 34, 38 

vectores ortogonales, 26 
vectores paralelos, 8 

vector unitario, 21 

vectores unitarios estándar, 22 


1. Marque cada uno de los siguientes enunciados como 
verdadero o falso: 


(a) Para los vectores u, v y wen R”, siu + w=v>+w 


entonces u = v. 


(b) Para los vectores u, v y wen R”, si u - w = v + w en- 


tonces u = v. 


(c) Para los vectores u, v y w en R’, si u es ortogonal a 
v, y v es ortogonal a w, entonces u es ortogonal a w. 


(d) En R’, si una recta € es paralela a un plano P, en- 
tonces un vector director d para € es paralelo a un 
vector normal n para P. 


(e) en R?, si una recta € es perpendicular a un plano P, 
entonces un vector director d para £ es paralelo a un 


vector normal n para P. 
(f) En R*, si dos planos no son paralelos, entonces 
deben intersectarse en una recta. 


(g) En R*, si dos rectas no son paralelas, entonces deben 


intersectarse en un punto. 


(h) Si v es un vector binario tal que v - v = 0, entonces 


v=0. 
(i) En Z, si ab = 0, entonces a = 0 o b = 0. 
(j) En Z, si ab = 0, entonces a = 0 o b = 0. 


=] 


3 
o = | [yei vector 4u + vse 
5 2 


2.siu= | 


dibuja con su origen en el punto (10, —10), encuentre 
las coordenadas del punto en la punta de 4u + v. 


. =1 3 
3. Siu = | Lly = H y 2x + u = 3(x — v), calcule x. 


. Sean A, B, C y D los vértices de un cuadrado con centro 


en el origen O, ordenados en el sentido de las manecillas 
del reloj. Sia = OA yb = OB, encuentre BC en térmi- 
nos de a yb. 


5. Encuentre el ángulo entre los vectores [—1, 1, 2] y 
[2, 1, —1]. 
1 1 
6. Encuentre la proyección de v = | 1 | sobre u = | —2 
1 2 
7. Encuentre un vector unitario en el plano xy que sea 
1 
ortogonal a | 2 |. 
3 


10. 


11. 


. Encuentre la ecuación general del plano que pasa por el 


punto (1, 1, 1) y es perpendicular a la recta con ecuacio- 
nes paramétricas 


y= L=-É 
y= 3+2 
z=-1>+ t 


. Encuentre la ecuación general del plano que pasa por el 


punto (3, 2, 5) y es paralelo al plano cuya ecuación ge- 
neral es 2x + 3y — z = 0. 


Encuentre la ecuación general del plano que pasa por 
los puntos A(1, 1, 0), B(1, 0, 1) y C(0, 1, 2). 

Encuentre el área del triángulo con vértices en A(1, 1, 0), 
B(1,0, 1) y C(0, 1, 2). 
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12. 


13. 


14. 


15. 
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Encuentre el punto medio del segmento de recta entre 
A = (5,1, -2) y B = (3, —7, 0). 

¿Por qué no hay vectores u y v en R” tales que [lu = 2, 
lv] =3yu-.v= -—7? 


Encuentre la distancia desde el punto (3, 2, 5) hasta el 
plano cuya ecuación general es 2x + 3y — z=0. 
Encuentre la distancia desde el punto (3, 2, 5) hasta la 


recta con ecuaciones paramétricas x=1t,y=1 + t, 
z=2+t. 


16. Calcule 3 — (2 + 4) (4 + 3) en Z,. 
17. Si es posible, resuelva 3(x + 2) = 5 en Z.. 
18. Si es posible, resuelva 3(x + 2) = 5en Zo. 
19. Calcule [2, 1, 3, 3] - [3, 4, 4,2] en Z4. 


20. Sea u = [1, 1, 1,0] en Z$. ¿Cuántos vectores binarios v 
satisfacen u - v = 0? 


El mundo está lleno de ecuaciones. . . 
Debe haber una respuesta para todo, 
si sólo supiéramos cómo plantear las 
ecuaciones. 
—Anne Tyler 
The Accidental Tourist 
Alfred A. Knopf, 1985, p. 235 


2.0 Introducción: trivialidad 


La palabra trivial se deriva de la raíz latina tri (“tres”) y de la palabra latina via (“ca- 
mino”). Por ende, literalmente, una trivialidad es un lugar donde se juntan tres caminos. 
Este punto de reunión común da lugar al otro significado, más popular, de trivial: lugar 
común, ordinario o insignificante. En las universidades medievales, el trivium consistía 
de las tres materias “comunes” (gramática, retórica y lógica) que se impartían antes del 
quadrivium (aritmética, geometría, música y astronomía). Los “tres caminos” que cons- 
tituían el trivium fueron el comienzo de las artes liberales. 

En esta sección comenzará el examen de los sistemas de ecuaciones lineales. El 
mismo sistema de ecuaciones puede verse en tres formas diferentes, aunque igualmente 
importantes; esos serán sus tres caminos, que conducirán todos a la misma solución. Ne- 
cesitará acostumbrarse a este camino triple de ver los sistemas de ecuaciones lineales, 
para que se conviertan en lugar común (¡trivial!) para usted. 

El sistema de ecuaciones que se considerará es 


2x+ y= 8 
y= 3y 


Problema 1 Dibuje las dos rectas representadas por dichas ecuaciones. ¿Cuál es su 
punto de intersección? 


2 1 
Problema 2 Considere los vectores u = A Ala . Dibuje la cuadrícula coor- 


denada determinada por u y v. [Sugerencia: dibuje primero, ligeramente, la cuadrícula 
coordenada estándar y úsela como auxiliar para dibujar la nueva.] 


Problema 3 En la cuadrícula u-v, encuentre las coordenadas dew =| 3 

Problema 4 Otra forma de enunciar el problema 3 es pedir los coeficientes de x y y 
para los que xu + yv = w. Escriba las dos ecuaciones a las cuales es equivalente esta 
ecuación vectorial (una para cada componente). ¿Qué observa? 

Problema 5 Ahora regrese a las rectas que dibujó para el problema 1. A la recta cuya 
ecuación es 2x + y = 8 se le referirá como recta 1, y a la recta cuya ecuación es x — 3y = —3 
como recta 2. Trace el punto (0, 0) sobre su gráfica para el problema 1 y etiquételo P,. Di- 
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Tabla 2.1 


Punto 


x 


0 


buje un segmento de recta horizontal de P, a la recta 1 y etiquete este nuevo punto P,. A con- 
tinuación, dibuje un segmento de recta vertical de P, a la recta 2 y etiquete este punto P,. 
Ahora dibuje un segmento de recta horizontal de P, ala recta 1 para obtener el punto P,. Con- 
tinúe de esta forma y dibuje segmentos verticales a la recta 2 seguidos por segmentos hori- 
zontales a la recta 1. ¿Qué parece estar ocurriendo? 

Problema 6 Con una calculadora con dos lugares decimales de precisión, encuentre 
las coordenadas (aproximadas) de los puntos P}, P,, P,, ..., P¿. (Descubrirá que es útil 
despejar primero la primera ecuación para x en términos de y y la segunda ecuación para 
y en términos de x.) Registre sus resultados en la tabla 2.1 y escriba por separado las co- 
ordenadas x y y de cada punto. 


Los resultados de estos problemas muestran que la tarea de “resolver” un sistema de 
ecuaciones lineales puede verse en varias formas. Repita el proceso descrito en los pro- 
blemas con los siguientes sistemas de ecuaciones: 


(a) 4x — 2y =0 (b)3x+2y= 9 (c)x+y=5 (d) x+2y=4 
x+2y=5 x+ 3y = 10 x=y=3 2x= y=3 


¿Todas sus observaciones de los problemas 1-6 todavía son válidas para estos ejemplos? 
Note cualquier similitud o diferencia. En este capítulo se explorarán estas ideas con más de- 
talle. 


Introducción a los sistemas de ecuaciones 
lineales 


Recuerde que la ecuación general de una recta en R? es de la forma 
ax + by =c 
y que la ecuación general de un plano en R? es de la forma 


ax + by + cz =d 


Las ecuaciones de esta forma se llaman ecuaciones lineales. 


Definición Una ecuación lineal en las n variables x, x»... , x, es una ecuación 


que puede escribirse en la forma 
axi t a Se 999 RS, = lo 


donde los coeficientes a,, a, . . . , a, y el término constante b son constantes. 


Ejemplo 2.1 


Las siguientes ecuaciones son lineales: 


3x — 4y = —1 r=is-%t=9 x + 5x, = 3 — x; + 2x, 


V2x 4 > (senZ)z =1  3.2x, — 0.01x, = 4.6 


Observe que la tercera ecuación es lineal porque puede reescribirse en la forma x, + 5x, 
+ x; — 2x, = 3. También es importante notar que, aunque en estos ejemplos (y en la 
mayoría de las aplicaciones) los coeficientes y términos constantes son números reales, 
en algunos ejemplos y aplicaciones serán números complejos o miembros de Z, para 
algún número primo p. 
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Las siguientes ecuaciones no son lineales: 


x 
xy +2z=1 TS A 


2) =1 senx, — 3x, + 25 = 0 


Por tanto, las ecuaciones lineales no contienen productos, recíprocos u otras funciones de 
las variables; las variables sólo aparecen a la primera potencia y sólo se multiplican por 
constantes. Ponga particular atención al cuarto ejemplo en cada lista: ¿por qué la cuarta 
ecuación en la primera lista es lineal, pero la cuarta ecuación en la segunda lista no lo es? 


-i 


Una solución de una ecuación lineal a,x, + a,x, + = + a,x, = b es un vector 


Wn 


[Sp S» - - -> 5, ] cuyos componentes satisfacen la ecuación cuando se sustituye x, = sp 


Xa S Sp... Xy T Sp 


Ejemplo 2.2 


z= 
(a) [5, 4] es una solución de x — 4y = —1 porque, cuando se sustituye x = 5 y y = 4, la 
ecuación se satisface: 3(5) — 4(4) = —1. [1, 1] es otra solución. En general, las soluciones 
simplemente corresponden a los puntos sobre la recta determinada por la ecuación 
dada. Por tanto, al hacer x = t y despejar y, se ve que el conjunto completo de soluciones 
puede escribirse en la forma paramétrica [t, + łt]. (También podría hacer y igual a 
algún parámetro, por decir, s, y despejar x; las dos soluciones paramétricas se verían 
diferentes, pero serían equivalentes. Inténtelo.) 


(b) La ecuación lineal x, — x, + 2x, = 3 tiene [3, 0, 0], [0, 1, 2] y [6, 1, —1] como solu- 
ciones específicas. El conjunto completo de soluciones corresponde al conjunto de pun- 
tos en el plano determinado por la ecuación dada. Si se hace x, = s y x, = t, entonces una 
solución paramétrica está dada por [3 + s — 2t, s, t].(¿Cuáles valores de s y t producen 
las tres soluciones específicas anteriores?) | 


Un sistema de ecuaciones lineales es un conjunto finito de ecuaciones lineales, cada 
una con las mismas variables. Una solución de un sistema de ecuaciones lineales es un 
vector que simultáneamente es una solución de cada ecuación en el sistema. El conjunto 
solución de un sistema de ecuaciones lineales es el conjunto de todas las soluciones del 
sistema. Al proceso de encontrar el conjunto solución de un sistema de ecuaciones linea- 
les se le conocerá como “resolver el sistema”. 


Ejemplo 2.3 


El sistema 
2x= y=3 
x+3y=5 


tiene [2,1] como una solución, pues es una solución de ambas ecuaciones. Por otra 
parte, [1, —1] no es una solución del sistema, porque sólo satisface la primera ecuación. 


-l 


Ejemplo 2.4 


> 
Resuelva los siguientes sistemas de ecuaciones lineales: 


(a)x=y=1 (db) x= y=2  (c)x=y=1 
x+y=3 2x = 2y = x=y=3 
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Figura 2.1 


—= 


Solución 

(a) Al sumar las dos ecuaciones se obtiene 2x = 4, de modo que x = 2, de donde se en- 
cuentra que y = 1. Una comprobación rápida confirma que [2, 1] es de hecho una solu- 
ción de ambas ecuaciones. Que ésta es la única solución que puede verse al observar que 
esta solución corresponde al (único) punto de intersección (2, 1) de las rectas con ecua- 
ciones x — y = l yx + y = 3, como se muestra en la figura 2.1(a). Por tanto, [2, 1] es una 
solución única. 


(b) La segunda ecuación en este sistema es justo el doble de la primera, de modo que las 
soluciones corresponden sólo a la primera ecuación: a saber, los puntos sobre la recta 
x — y = 2. Las mismas pueden representarse paramétricamente como [2 + t, t]. Por 
tanto, este sistema tiene un número infinito de soluciones [figura 2.1(b)]. 


(c) Dos números x y y no pueden tener simultáneamente una diferencia de 1 y 3. Por 
tanto, este sistema no tiene soluciones. (Un planteamiento más algebraico puede ser restar 
la segunda ecuación de la primera, lo que produce la conclusión absurda 0 = 2.) Como 
muestra la figura 2.1(c), en este caso las rectas para las ecuaciones son paralelas. 


> 
E 


Un sistema de ecuaciones lineales se llama consistente si tiene al menos una solu- 
ción. Un sistema sin soluciones se llama inconsistente. Aun cuando sean pequeños, los 
tres sistemas en el ejemplo 2.4 ilustran las únicas tres posibilidades para el número de so- 
luciones de un sistema de ecuaciones lineales con coeficientes reales. Más tarde se pro- 
bará que estas mismas tres posibilidades se sostienen para cualquier sistema de ecuacio- 
nes lineales sobre los números reales. 


Un sistema de ecuaciones lineales con coeficientes reales tiene 


(a) una solución única (un sistema consistente) o 
(b) un número infinito de soluciones (un sistema consistente) o 
(c) ninguna solución (un sistema inconsistente). 


Dos sistemas lineales se llaman equivalentes si tienen los mismos conjuntos solución. 
Por ejemplo, 


x=yp=1 y *=y=1 
x+y=3 y=1 


son equivalentes, pues ambos tienen la solución única [2, 1]. (Compruébelo.) 
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El planteamiento para resolver un sistema de ecuaciones lineales es transformar el 
sistema dado en uno equivalente que sea más fácil de resolver. El patrón triangular del 
segundo ejemplo anterior (en el que la segunda ecuación tiene una variable menos que 
la primera) es el que se buscará. 


Ejemplo 2.5 


Resuelva el sistema 


x=y= z= 
y + 3z= 
5z = 10 


Solución A partir de la última ecuación y trabajando hacia atrás, se descubre sucesiva- 
mente que z = 2, y = 5 — 3(2) = —1 yx = 2 + (—1) + 2 = 3. De modo que la solución 


única es [3, —1, 2]. 


El procedimiento que se usó para resolver el ejemplo 2.5 se llama sustitución hacia 
atrás. 

Ahora se regresa a la estrategia general para transformar un sistema dado en uno 
equivalente que puede resolverse fácilmente mediante sustitución hacia atrás. Este pro- 
ceso se describirá con mayor detalle en la siguiente sección; por ahora, simplemente se le 
observará en acción en un solo ejemplo. 


Ejemplo 2.6 


La palabra matriz se deriva de la 
palabra latina mater, que significa 
“madre”. Cuando se agrega el su- 
fijo —ix, el significado se convierte 
en “útero”. Así como un útero 
rodea un feto, los corchetes de una 
matriz rodean sus entradas, y así 
como el útero da origen a un bebé, 
una matriz da origen a ciertos 
tipos de funciones llamadas trans- 
formaciones lineales. Una matriz 
con mm renglones y n columnas se 
llama matriz de m X n (pronún- 
ciese “m por n”). 


Resuelva el sistema 
x= y= z= 2 
3x — 3y + 2z = 16 
2x— y+ z= 9 


Solución Para transformar este sistema en uno que muestre la estructura triangular del 
ejemplo 2.5, primero es necesario eliminar la variable x de las ecuaciones 2 y 3. Observe 
que restar de las ecuaciones 2 y 3 múltiplos adecuados de la ecuación 1 hará el truco. A 
continuación, observe que se opera sobre los coeficientes, no sobre las variables, de 
modo que puede ahorrar cierta escritura si registra los coeficientes y términos constan- 
tes en la matriz 


i 1 1/2 
3 —3 2|16 
2 il 1/9 


donde las primeras tres columnas contienen los coeficientes de las variables en orden, la 
columna final contiene los términos constantes y la barra vertical sirve para recordar los 
signos igual en las ecuaciones. Esta matriz se llama matriz aumentada del sistema. 

Existen varias formas de convertir el sistema dado en uno con el patrón triangular 
que se busca. Los pasos que se usarán aquí son los más cercanos en espíritu al método 
más general que se describe en la siguiente sección. Se realizará la secuencia de opera- 
ciones sobre un sistema dado y simultáneamente sobre la matriz aumentada correspon- 
diente. Comience por eliminar x de las ecuaciones 2 y 3. 


e y z= 2 L <= == 12 
3x — 3y + 2z = 16 3 =3 2|16 
2x= yt z 2 =l 1| 9 


II 
No) 
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Reste 3 veces la primera ecuación 
de la segunda ecuación: 


x=y-  z= 2 
5z = 10 
2x=y+ z= 9 


Reste 2 veces la primera ecuación 
de la tercera ecuación: 


Reste 3 veces el primer renglón 
del segundo renglón: 


L =i = 2 
0 0 5|10 
2. =] 1| 9 


Reste 2 veces el primer renglón 
del tercer renglón: 


x=y-= 2z=2 1 -1 -1|2 
5z=10 0 0 5|10 
y+3z= 5 0. t 315 


Intercambie las ecuaciones 2 y 3: 


x=y= 2= 2 i r A 
y+3z= 0 1 3 
5z=10 0 0 5|10 


Éste es el mismo sistema que se resolvió usando la sustitución hacia atrás en el ejemplo 
2.5, donde se descubrió que la solución era [3, —1, 2]. Por tanto, ésta también es la solu- 
ción al sistema dado en este ejemplo. ¿Por qué? El cálculo anterior muestra que cualquier 
solución del sistema dado también es una solución del sistema final, pero, dado que los 
pasos recién realizados son reversibles, podría recuperar el sistema original a partir del 
sistema final. (¿Cómo?) Por tanto, cualquier solución del sistema final también es una so- 
lución del sistema dado. Por ende, los sistemas son equivalentes (como lo son todos los 
»— obtenidos en los pasos intermedios anteriores). Más aún, se puede trabajar con matrices 
en lugar de ecuaciones, pues es asunto simple reinsertar las variables antes de proceder 
con la sustitución hacia atrás. (Trabajar con matrices es el tema de la siguiente sección.) 


-t 


Comentario Las calculadoras con capacidades matriciales y los sistemas algebraicos 
de cómputo (CAS por sus siglas en inglés) pueden facilitar la resolución de sistemas de 
ecuaciones lineales, en particular cuando los sistemas son grandes o tienen coeficientes 
que no son “bonitos”, como suele ser el caso en aplicaciones de la vida real. Sin embargo, 
como siempre, debe hacer tantos ejemplos como pueda con lápiz y papel hasta que se 
sienta cómodo con las técnicas. Incluso si se solicita una calculadora o CAS, piense en 
cómo realizaría los cálculos de forma manual antes de hacer algo. Después de obtener 
una respuesta, asegúrese de pensar si es razonable. 

No se confunda al pensar que la tecnología siempre le dará la respuesta más rápido o 
más fácilmente que los cálculos a mano. ¡En ocasiones pueden no darle la respuesta en 
absoluto! Los errores de redondeo asociados con la aritmética de punto flotante que 
usan las calculadoras y computadoras pueden causar serios problemas y conducir a res- 
puestas totalmente erróneas a ciertos problemas. Vea la Exploración “Mentiras que me 
dice mi computadora” para un vistazo del problema. (¡Está advertido!) 


Sección 2.1 


f Ejercicios 2.1 
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En los ejercicios 1-6, determine cuáles son ecuaciones lineales 
con las variables x, y y z. Si alguna ecuación no es lineal, expli- 
que por qué. 

1.x — my + VW3z=0 2x +y +z =l 


1 T 
3.x + 7y + z= sen 9 


4.2x—xy=5z=0 
6. (cos 3)x — 4y + z = V3 


5. 3 cos x — 4y + z = V3 


En los ejercicios 7-10, encuentre una ecuación lineal que tenga 
el mismo conjunto solución que la ecuación dada (posible- 
mente con algunas restricciones sobre las variables). 


x-y 
7.2x +y =7-— 3y 8. =a 
x=y 
1 1 4 
e AE 10. logo x — logy = 2 


xx yY W 


En los ejercicios 11-14, encuentre el conjunto solución de cada 
ecuación. 


11. 3x — 6y = 0 
13. x + 2y + 3z=4 


12. 2x, + 3x3 = 35 
14. 4x, + 3x, + 2x, = 1 


En los ejercicios 15-18, dibuje gráficas que correspondan a los 
sistemas lineales dados. Determine geométricamente si cada 
sistema tiene una solución única, un número infinito de solu- 
ciones o ninguna solución. Luego resuelva cada sistema alge- 
braicamente para confirmar su respuesta. 


15. x+y=0 16. x—2y=7 
2x+y=3 3x+ y=7 

17. 3x— 6y = 3 18. 0.10x—0.05y= 0.20 
=x + 2y=1 —0.06x + 0.03y = —0.12 


En los ejercicios 19-24, resuelva el sistema dado mediante susti- 
tución hacia atrás. 


19.x-2y=1 20. 2u — 3v=5 
y=3 2v=6 
Z2l.x= yt z= 0 22.x, +2x,+ 3x,=0 
2y= z= 1 —=5x, +2x3=0 
J= =L 4x, =0 
ZII TERR SAA 24.x—3y+ z= 5 
e ie y=22=-=1 


x= x=0 
x=1 


Los sistemas en los ejercicios 25 y 26 muestran un patrón 
“triangular inferior” que las hace fáciles de resolver mediante 
sustitución hacia atrás. (La sustitución hacia adelante se en- 
contrará nuevamente en el capítulo 3.) Resuelva estos siste- 
mas. 


Z5 xX = 2 26. x =-=] 
2x + y = =3 —3x, + 2, = 5 
—3x — 4y + z = —10 3 + 2x, + x= 7 


Encuentre las matrices aumentadas de los sistemas lineales en 
los ejercicios 27-30. 


27. x—y=0 28. 2x; F 3x% = x=1 

2x+y=3 Ši + x3=0 

=x; + 2x, = 2x,=0 

29. x+5y=-1l 30. a— 2b + d=2 

=% + y= =5 a+ b=c-3d=1 
2x+4y= 4 


En los ejercicios 31 y 32, encuentre un sistema de ecuaciones 
lineales que tenga la matriz dada como su matriz aumentada. 


0 1 111 
31.|1 —1 0|1 
2. =Y 1/1 
L =i 003 1|2 
32.| 1 1.2.1 -—1|4 
0 1.0.2 3/0 


Para los ejercicios 33-38, resuelva los sistemas lineales en los 
ejercicios dados. 


33. Ejercicio 27 
35. Ejercicio 29 
37. Ejercicio 31 


34. Ejercicio 28 
36. Ejercicio 30 
38. Ejercicio 32 


39. (a) Encuentre un sistema de dos ecuaciones lineales con 
las variables x y y cuyo conjunto solución esté dado 
por las ecuaciones paramétricas x = ty y = 3 — 2t. 


(b) Encuentre otra solución paramétrica para el sistema 
en el inciso (a) en el que el parámetro es sy y = s. 


40. (a) Encuentre un sistema de dos ecuaciones lineales con 
las variables x,, X, y x, cuyo conjunto solución esté 
dado por las ecuaciones paramétricas x, = t, x, = 
It = 2. E 

(b) Encuentre otra solución paramétrica para el sis- 
tema en el inciso (a) en el que el parámetro es s y 
Xx, =s. 
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En los ejercicios 41-44, los sistemas de ecuaciones son no linea- 
les. Encuentre sustituciones (cambios de variables) que con- 
viertan cada sistema en un sistema lineal y use este último 
para ayudar a resolver el sistema dado. 


3 


41. -+-=0 


Ria 


42. 1 +2y?=6 


x? — y =3 
43. tan x — 2 sen y = 2 
tanx= seny+cosz= 2 
sen y — cosz= —1 


44. —2° +2(3”) =1 
3(2%) — 4(3>) = 1 


Métodos directos para resolver sistemas 


En esta sección se verá un procedimiento sistemático general para resolver un sistema de 
ecuaciones lineales. Este procedimiento se basa en la idea de reducir la matriz aumen- 
tada del sistema dado a una forma que luego pueda resolverse mediante sustitución 
hacia atrás. El método es directo en el sentido de que conduce directamente a la solución 
(si existe una) en un número finito de pasos. En la sección 2.5 se considerarán algunos 
métodos indirectos que funcionan en una forma completamente diferente. 


Existen dos importantes matrices asociadas con un sistema lineal. La matriz de coefi- 
cientes contiene los coeficientes de las variables, y la matriz aumentada (que ya se en- 
contró) es la matriz coeficiente aumentada por una columna adicional que contiene los 


términos constantes. 
Para el sistema 


la matriz de coeficientes es 


y la matriz aumentada es 


2x+ y= 2=3 
x +oaz= 1 
=x + 3y = 2z=080 


2 1 =l 

1 0 5 
SL. 3 =2 
2 1 = 
=] =2 0 


Observe que si falta una variable (como y en la segunda ecuación), su coeficiente 0 se in- 
gresa en la posición adecuada de la matriz. Si la matriz de coeficientes de un sistema li- 
neal se denota con A y el vector columna de términos constantes con b, entonces la 
forma de la matriz aumentada es [A | b]. 


La palabra escalonada proviene de 
la palabra latina scala, que significa 
“escalera”. La palabra francesa para 
“escalera”, échelle, también se de- 
riva de esta base latina. Una matriz 
en forma escalonada muestra un 
patrón en escalera. 
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Al resolver un sistema lineal, no siempre será posible reducir la matriz de coeficien- 
tes a la forma triangular, como se hizo en el ejemplo 2.6. Sin embargo, siempre se puede 
lograr un patrón en escalera en las entradas distintas de cero de la matriz final. 


Definición Una matriz está en forma escalonada por renglones si satisface las si- 
guientes propiedades: 


1. Cualquier renglón que consiste completamente de ceros está en la parte baja. 

2. En cada renglón distinto de cero, el primer elemento distinto de cero (llamado 
elemento pivote) está en una columna a la izquierda de cualquier elemento pivote 
bajo él. 


Observe que estas propiedades garantizan que los elementos pivote formen un pa- 
trón en escalera. En particular, en cualquier columna que contenga un elemento pivote, 
todas las entradas bajo el elemento pivote son cero, como ilustran los siguientes ejem- 
plos. 


Ejemplo 2.7 


Las siguientes matrices están en forma escalonada por renglones: 


0 2 OU 1 =L 3 
A LU l LL 21 

0 0 ¿UI 
0 [HU 0 HS 0.0 1 3 

0 0 0 0 0 
0 00 0 0 4 0000 

0 0 0 0 5 


0 E 
Si una matriz en forma escalonada por renglones en realidad es la matriz aumentada 


de un sistema lineal, el sistema es bastante fácil de resolver mediante sustitución hacia 
atrás solamente. 


Ejemplo 2.8 


= 
Si supone que cada una de las matrices en el ejemplo 2.7 es una matriz aumentada, es- 
criba los sistemas correspondientes de ecuaciones lineales y resuélvalos. 


Solución Recuerde primero que la última columna en una matriz aumentada es el vec- 
tor de términos constantes. Entonces la primera matriz corresponde al sistema 


2x; + 4x, = 1 

=x, = 2 
(Advierta que se eliminó la última ecuación 0 = 0 0 0x, + 0x, = 0, que claramente es sa- 
tisfecha por cualquier valor de x, y x,.) La sustitución hacia atrás produce x, = —2 y en- 


tonces 2x, = 1 — 4(—2) = 9, de modo que x, = 3. La solución es [3, —2]. 
La segunda matriz tiene el sistema correspondiente 


X =1 
X, =5 
0=4 


La última ecuación representa Ox, + 0x, = 4, que claramente no tiene solución. Por 
tanto, el sistema no tiene soluciones. De igual modo, el sistema que corresponde a la 
cuarta matriz no tiene soluciones. Para el sistema que corresponde a la tercera matriz, se 
tiene 
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x tx, t2% = 1 


x% = 3 


de modo que x, = 1 — 2(3) — x, = —5 — x,. Existe un número infinito de soluciones, 
pues a x, se le puede asignar cualquier valor t para obtener la solución paramétrica 


[=5 = £,£ 31. 


Ahora se describe el procedimiento mediante el cual cualquier matriz puede reducirse a 
una matriz en forma escalonada por renglones. Las operaciones permisibles, llamadas 
operaciones elementales con renglones, corresponden a las operaciones que pueden re- 
alizarse sobre un sistema de ecuaciones lineales para transformarlo en un sistema equi- 
valente. 


Definición Las siguientes operaciones elementales con renglones pueden reali- 
zarse sobre una matriz: 


1. Intercambiar dos renglones. 
2. Multiplicar un renglón por una constante distinta de cero. 
3. Sumar un múltiplo de un renglón a otro renglón. 


Observe que la división de un renglón entre una constante distinta de cero está im- 
plícita en la definición anterior pues, por ejemplo, dividir un renglón entre 2 es lo mismo 
que multiplicarlo por 5. De igual modo, restar un múltiplo en un renglón de otro ren- 
glón es lo mismo que sumar un múltiplo negativo de un renglón a otro renglón. 

Se usará la siguiente notación abreviada para las tres operaciones elementales con 
renglones: 


1. R¡+ R; significa intercambiar renglones i y j. 

2. kR; significa multiplicar el renglón i por k. 

3. R; + kR; significa sumar k veces el renglón j al renglón i (y sustituir el renglón í con 
el resultado). 


El proceso de aplicar operaciones elementales con renglones para llevar una matriz a 
la forma escalonada por renglones, llamado reducción de renglón, se usa para reducir 
una matriz a la forma escalonada. 


Ejemplo 2.9 Reduzca la siguiente matriz a forma escalonada: 


L. 2. = 24 5 
2 4 0 2 
2 9 5 
=1 1 6 5 


Solución Trabaje columna por columna, de izquierda a derecha y de arriba abajo. La 
estrategia es crear un elemento pivote en una columna y luego usarlo para crear ceros 
abajo de él. El elemento elegido para convertirse en elemento pivote se llama simple- 
mente pivote, y esta fase del proceso se conoce como pivoteo. Aunque no es estricta- 
mente necesario, con frecuencia es conveniente usar la segunda operación elemental de 
renglón para convertir en 1 cada elemento pivote. 
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Comience por introducir ceros en la primera columna abajo del 1 pivote en el pri- 
mer renglón: 


1 2 -4 Sie fi 2 -4 -4 5 
R,—2R, 

24 0 02 0 0 8 8 -8 
R+ R, 

23 2 1 5|—>lo <= 10 9 —5 

-1 1 3 6 5 0 3 -1 2 10 


Ahora la primera columna está como se quiere, de modo que la siguiente cosa por hacer 
es crear un elemento pivote en el segundo renglón, en busca del patrón en escalera de la 
forma escalonada. En este caso, se hace al intercambiar renglones. (También podría 
sumar los renglones 3 o 4 al renglón 2.) 


R: R; 
8 Ss =8 
3 =l 2 10 


O O O m 
o 


El pivote esta vez fue — 1. Ahora se crea un cero en la parte baja de la columna 2, usando 
el elemento pivote —1 en el renglón 2: 


R,¿+3R, 


ooor-r 
o 
00 
00 
| 
0 


O. 29. 29 =5 


Ahora se hace la columna 2. Al notar que ya se tiene un elemento pivote en la columna 3, 
sólo se pivotea en el 8 para introducir un cero debajo de él. Esto es más sencillo si pri- 
mero se divide el renglón 3 entre 8: 


aR 
1 -1 
0 29 29 —5 


O O OO m 
© 
— 


Ahora use el 1 pivote en el renglón 3 para crear un cero debajo de él: 


R,¿—29R, 
—— 


O O O m 
o 
Rh 
Rh 
| 
h 


Con este paso final, la matriz se redujo a forma escalonada. 


Comentarios -+ 


+ La forma escalonada por renglones de una matriz no es única. (Encuentre una 
forma escalonada por renglones diferente para la matriz del ejemplo 2.9.) 
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e El elemento pivote en cada renglón se usa para crear los ceros debajo de él. 

+ Los pivotes no necesariamente son los elementos que están originalmente en las 
posiciones que al final ocupan los elementos pivote. En el ejemplo 2.9, los pivotes fue- 
ron 1, —1,8 y 24. La matriz original tenía 1, 4, 2 y 5 en dichas posiciones sobre la “esca- 
lera”. 

e Una vez que se pivotea y se introducen ceros bajo el elemento pivote en una co- 
lumna, dicha columna no cambia. En otras palabras, la forma escalonada por renglones 
surge de izquierda a derecha, de arriba abajo. 


Las operaciones elementales con renglones son reversibles; esto es, pueden “desha- 
cerse”. Por ende, si alguna operación elemental con renglones convierte A en B, existe 
también una forma escalonada por renglones que convierte B en A. (Vea los ejercicios 15 
y 16.) 


Definición Las matrices A y B son equivalentes por renglones si existe una se- 
cuencia de operaciones elementales con renglones que convierta A en B. 


Las matrices en el ejemplo 2.9, 


DS dá il 2 =i 5 
24 0 02 0 -1 10 9 -5 
23 2 15| + lo o 1 1-1 
=j i $ 635 0. 0 0 0 24 


son equivalentes por renglones. Sin embargo, en general, ¿cómo puede decirse si dos ma- 
trices son equivalentes por renglones? 


Teorema 2.1 


Las matrices A y B son equivalentes por renglones si y sólo si pueden reducirse a la 
misma forma escalonada por renglones. 


Demostración Si A y B son equivalentes por renglones, entonces más operaciones con 
renglones reducirán B (y por tanto a A) a la (misma) forma escalonada por renglones. 

Recíprocamente, si A y B tienen la misma forma escalonada por renglones R, enton- 
ces, mediante operaciones elementales con renglones, puede convertirse A en Ry B en R. 
Al invertir la última secuencia de operaciones, puede convertir R en B, y por tanto la se- 
cuencia A — R —> B logra el efecto deseado. _ 3 


Comentario En la práctica, el Teorema 2.1 es más fácil de usar si R es la forma 
escalonada reducida por renglones de A y B, como se define en la página 79. Vea los ejer- 
cicios 17 y 18. 


Cuando se aplica la reducción por renglones a la matriz aumentada de un sistema de 
ecuaciones lineales, se crea un sistema equivalente que puede resolverse mediante susti- 
tución hacia atrás. Todo el proceso se conoce como eliminación gaussiana. 
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Je 

1. Escriba la matriz aumentada del sistema de ecuaciones lineales. 

2. Use operaciones elementales con renglones para reducir la matriz aumentada a 
forma escalonada por renglones. 

3. Con sustitución hacia atrás, resuelva el sistema equivalente que corresponda a la ma- 


triz reducida por renglones. 


Comentario Cuando se realiza a mano, el paso 2 de la eliminación gaussiana per- 
mite muchas opciones. He aquí algunos lineamientos útiles: 


(a) Localice la columna de la extrema izquierda que no sea toda ceros. 


(b) Cree un elemento pivote en la parte superior de esta columna. (Por lo general será 
más sencillo si la convierte en 1 pivote. Vea el ejercicio 22.) 

(c) Use el elemento pivote para crear ceros debajo de él. 

(d) Cubra el renglón que contiene el elemento pivote y regrese al paso (a) para repetir 
el procedimiento sobre la submatriz restante. Deténgase cuando toda la matriz esté en 
forma escalonada por renglones. 


Ejemplo 2.10 


Resuelva el sistema 


2x, + 3x3 = 
2x1 +3 + x 


== x= 2 ==5 


Solución La matriz aumentada es 


l =1 =2|=5 


Proceda a reducir esta matriz a forma escalonada por renglones y siga los lineamientos 
dados para el paso 2 del proceso. La primera columna distinta de cero es la columna 1. 


Carl Friedrich Gauss (1777-1855) es considerado generalmente uno de los tres más grandes 
matemáticos de todos los tiempos, junto con Arquímedes y Newton. Con frecuencia se le llama 
“príncipe de los matemáticos”, un sobrenombre que merecía con creces. Niño prodigio, Gauss 
supuestamente era capaz de hacer aritmética antes de poder hablar. A la edad de 3 años, corrigió 
un error en los cálculos de su padre para la nómina de la compañía, y como joven estudiante 
descubrió la fórmula n(n + 1)/2 para la suma de los primeros n números naturales. Cuando 
tenía 19, demostró que podía construirse un polígono de 17 lados usando solamente regla y 
compás, y a los 21 demostró, en su disertación doctoral, que todo polinomio de grado n con 
coeficientes reales o complejos tenía exactamente n ceros, contando múltiples ceros: el teorema 
fundamental del álgebra. 

La publicación en 1801 de Gauss, Disquisitiones Arithmeticae, se considera generalmente el 
fundamento de la moderna teoría de números, pero hizo aportaciones a casi cada rama de las 
matemáticas, así como a la estadística, la física, la astronomía y la topografía. Gauss no publicó 
todos sus hallazgos, probablemente porque era muy crítico de su propio trabajo. Tampoco le 
gustaba dar clases y con frecuencia criticaba a otros matemáticos, acaso porque descubrió, mas 
no publicó, sus resultados antes que ellos. 

El método llamado eliminación gaussiana lo conocían los chinos en el tercer siglo antes de 
Cristo, pero lleva el nombre de Gauss debido a su redescubrimiento en un ensayo en el que re- 
solvió un sistema de ecuaciones lineales para describir la órbita de un asteroide. 
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Comience por crear un elemento pivote en la parte superior de esta columna; e inter- 
cambiar los renglones 1 y 3 es la mejor forma de lograr esto. 


0 2 3| 8 1 -1 -2|-5 
$ ils j2 3. als 
1-1 -2|-5 0 2 3| 8 


Ahora cree un segundo cero en la primera columna, usando el 1 pivote: 


=1. =2|=5 


Cubra ahora el primer renglón y repita el procedimiento. La segunda columna es la pri- 
mera columna distinta de cero de la submatriz. Al multiplicar el renglón 2 por į creará 
un 1 pivote. 


1 -1 -2|-5] i =ï A 
o 5 sul Blo i als 
o 2 3| 8 ö 2 3135 


Ahora necesita otro cero en la parte baja de la columna 2: 


=] =2[=5 


La matriz aumentada ahora está en forma escalonada por renglones y se avanza al paso 3. 
El sistema correspondiente es 


== 2. = =5 
X% + x= 
x= 2 


y la sustitución hacia atrás produce x, = 3, entonces x, = 3 — x, = 3 — 2 = 1, y final- 
mente x, = —5 + x, + 2x, = —5 + 1 + 4 = 0. La solución se escribe en forma vec- 
torial como 


Ejemplo 2.11 


0 
1 
2 
(A partir de ahora, las soluciones vectoriales de los sistemas lineales se escribirán como 
vectores columna. La razón de esto será clara en el capítulo 3.) 
> 


Resuelva el sistema 
WE Sy 1 
2w — 2x- y + 3z= 3 
=w A Y = -3 
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Solución La matriz aumentada es 


L osi SL -2 d 
2 =2 =I 3| 3 
=1 rl o =1 0]=3 


que puede reducirse por renglones del modo siguiente: 


1-1 -1 2| 1]* [1 -1 -—1 2| 1 
R +R, 


2 2 =2" =b 3| 3[.—3]|0 0 i. =1 1 
=] 1 =1_0|=3 0 0 -2 2 1=2 
=] =] 2|1 
R,+2R, 
—> 0 pas 


El sistema asociado ahora es 


w=x=y+2z=1 
y= z 


II 
= 


que tiene un número infinito de soluciones. Existe más de una forma de asignar pará- 
metros, pero se procederá a usar sustitución hacia atrás, y escribir las variables corres- 
pondientes a los elementos pivote (las variables pivote) en términos de las otras varia- 
bles (las variables libres). 

En este caso, las variables pivote son w y y, y las variables libres son x y z. Por tanto, 
y = 1 + z,y a partir de esto se obtiene 


wW=1+x+y-— 2z 
=1+x+(1+2)- 2z 
=24 Xx =2Z 


Si se asignan los parámetros x = s y z = t, la solución puede escribirse en forma vectorial 
como 


w 2+s-t 2 1 =f 
x s 0 1 0 
= = +s a 
y l+t 1 0 1 
z t 0 0 1 


El ejemplo 2.11 destaca una propiedad muy importante: en un sistema consistente, 
las variables libres son las que no son variables pivote. Dado que el número de variables 
pivote es el número de renglones distintos de cero en la forma escalonada por renglones 
de la matriz de coeficientes, puede predecirse el número de variables libres (parámetros) 
antes de encontrar la solución explícita con el uso de sustitución hacia atrás. En el capí- 
tulo 3 se probará que, aunque la forma escalonada por renglones de una matriz no es 
única, el número de renglones distintos de cero es el mismo en todas las formas escalo- 
nadas por renglones de una matriz dada. Por tanto, tiene sentido dar un nombre a este 
número. 
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Definición El rank de una matriz es el número de renglones distintos de cero en 
su forma escalonada por renglones. 


El rank de una matriz A se denotará mediante rank(A). En el ejemplo 2.10, el rank 
de la matriz de coeficientes es 3, y en el ejemplo 2.11, el rank de la matriz de coeficientes 
es 2. Las observaciones recién realizadas justifican el siguiente teorema, que se demos- 
trará con más generalidad en los capítulos 3 y 6. 


Teorema 2.2 


El teorema del rank 


Sea A la matriz de coeficientes de un sistema de ecuaciones lineales con n variables. Si 
el sistema es consistente, entonces 


número de variables libres = n — rank(4) 


Por tanto, en el ejemplo 2.10, se tiene 3 — 3 = 0 variables libres (en otras palabras, una 
solución única), y en el ejemplo 2.11, se tiene 4 — 2 = 2 variables libres, como se encon- 
tró. 


Ejemplo 2.12 


Wilhelm Jordan (1842-1899) fue un 
profesor alemán de geodesia cuyas 
aportaciones a la resolución de sis- 
temas lineales fue un método sis- 
temático de sustitución hacia atrás 
estrechamente relacionado con el 
descrito aquí. 


Resuelva el sistema 
x= x+2x%= 3 
Xr F2% = ý% = = 


2x; = 2x; = 1 
Solución Cuando la matriz aumentada se reduce por renglones, se tiene 


1 =I 21 3 1 —1 2| 3 


R,—2R, 


Ep a . .z 7 2 

lo que conduce a la ecuación imposible 0 = 5. (También podría hacerse R, — §R, como la 
segunda operación elemental con renglones, lo que daría la misma contradicción pero 
una forma escalonada por renglones diferente.) Por tanto, el sistema no tiene soluciones: 


es inconsistente. 


Una modificación de la eliminación gaussiana simplifica enormemente la fase de susti- 
tución hacia atrás y es particularmente útil cuando se hacen cálculos a mano en un sis- 


Para una demostración breve de 
que la forma escalonada reducida 
por renglones de una matriz es 
única, vea el artículo de Thomas 
Yuster, “The Reduced Row Echelon 
Form of a Matrix Is Unique: A Sim- 
ple Proof”, en el número de marzo 
de 1984 de Mathematics Magazine 
(vol. 57, núm. 2, pp. 93-94). 
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tema con un número infinito de soluciones. Esta variante, conocida como eliminación 
de Gauss-Jordan, se apoya en reducir aún más la matriz aumentada. 


Definición Una matriz está en forma escalonada reducida por renglones si sa- 
tisface las siguientes propiedades: 

1. Está en forma escalonada por renglones. 

2. El elemento pivote en cada renglón distinto de cero es 1 (llamado 1 pivote). 

3. Cada columna que contiene un 1 pivote tiene ceros en todos los otros lugares. 


La siguiente matriz está en forma escalonada reducida por renglones: 


1200 -3 1 0 
0 0 1 0 4 -1 0 
0 0 0 1 3 =2 0 
00.00 0 0 1 
0 000 0 0 0 


Para matrices de 2 X 2, las posibles formas escalonadas reducidas por renglones son 
pi la] eo 
o 1P lo oP lo ol” loo 
donde * puede ser cualquier número. 

Es claro que, después de que una matriz se reduce a forma escalonada, posteriores 
operaciones elementales con renglones la llevarán a la forma escalonada reducida por 
renglones. Lo que no es claro (aunque la intuición puede sugerirlo) es que, a diferencia 
de la forma escalonada por renglones, la forma escalonada reducida por renglones de 
una matriz es única. 


En la eliminación de Gauss-Jordan, se procede como en la eliminación gaussiana, 
pero la matriz aumentada se reduce a la forma escalonada reducida por renglones. 


Eliminación de 
Gauss-Jordan 


> 


1. Escriba la matriz aumentada del sistema de ecuaciones lineales. 

2. Use operaciones elementales con renglones para reducir la matriz aumentada a la 
forma escalonada reducida por renglones. 

3. Si el sistema resultante es consistente, resuelva para las variables pivote en términos 
de cualquier variable libre restante. 


Ejemplo 2.13 


Resuelva el sistema en el ejemplo 2.11 mediante eliminación de Gauss-Jordan. 


Solución La reducción procede como se hizo en el ejemplo 2.11, hasta que se llega a la 
forma escalonada: 
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Ahora debe crear un cero arriba del 1 pivote en el segundo renglón, tercera columna. 
Esto se hace al sumar el renglón 2 al renglón 1 para obtener 


0 == 
0 0 0|0 
Ahora el sistema se reduce a 
w=% +z=2 
y=z=1 


Ahora es mucho más fácil resolver para las variables pivote: 
wW=2+x-z y y=1>+z 


Si se asignan los parámetros x = s y z = t como antes, la solución puede escribirse en 
forma vectorial como 


N xS k 2 
+ 
= 


Ed 


Comentario Desde un punto de vista computacional, es más eficiente (en el sentido 
de que requiere menos cálculos) primero reducir la matriz a forma escalonada por ren- 
glones y luego, de derecha a izquierda, convertir cada elemento pivote a 1 y crear ceros 
arriba de dichos 1 pivote. Sin embargo, para cálculo manual, descubrirá que es más sen- 
cillo sólo trabajar de izquierda a derecha y crear los 1 pivote y los ceros en sus columnas 
conforme avance. 

Regrese a la geometría que lo llevó a este punto. Así como los sistemas de ecuaciones 
lineales en dos variables corresponden a rectas en [R?, del mismo modo las ecuaciones li- 
neales en tres variables corresponden a planos en R°. De hecho, muchas preguntas acerca 
de rectas y planos pueden responderse al resolver un sistema lineal adecuado. 


Ejemplo 2.14 


Encuentre la recta de intersección de los planos x + 2y —z=3y2x+3y+z=l. 


Solución Primero, observe que habrá una recta de intersección, pues los vectores nor- 
males de los dos planos, [1, 2, —1] y [2, 3, 1], no son paralelos. Los puntos que yacen en 
la intersección de los dos planos corresponden a los puntos en el conjunto solución del 
sistema 


xt2y=z=3 
2x + 3y +z 


II 
ʻi 


Aplicar la eliminación de Gauss-Jordan a la matriz aumentada produce 
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aaa 


í = 2 -1 


2 3 1/1 0 —1 3 
R¡+2R, 
r [1.0 5 sl 
0 1 -3 5 
Al sustituir variables se tiene 
x + 5z = -7 
y=3z= 5 


La variable libre z se iguala al parámetro t y por tanto se obtienen las ecuaciones para- 
métricas de la recta de intersección de los dos planos: 


x= =/= 5t 
y= 5+3t 
z= f 
En forma vectorial, la ecuación es 
x =7 =3 
= 5i+t 3 
Figura 2.2 z 0 1 
La intersección de dos planos 
Vea la figura 2.2. 
> 
Ejemplo 2.15 1 0 1 3 
Sea p = 011q=|2|u=|1|yv= | -—1 |. Determine si las rectas x = p + tu 
=] 1 1 =1 


yx = q + tv se intersectan y, si es así, encuentre su punto de intersección. 


Solución Debe tener cuidado. Aunque t se usó como el parámetro en las ecuaciones de 

ambas rectas, éstas son independientes y, por tanto, lo son sus parámetros. Use un 

parámetro diferente (por decir, s) para la primera recta, de modo que su ecuación se 

convierte en x = p + su. Si las rectas se intersectan, entonces se quiere encontrar 
x 


x = | y | que satisfaga ambas ecuaciones simultáneamente. Esto es, se quiere x = p + 
Z 
su=q+ttvosu—tv=q-P. 
Al sustituir los p, q, u y v dados, se obtienen las ecuaciones 


s— 3t= -1 
s+ t= 2 
s+ t= 2 


ez Lo. 5 3 ú 
cuya solución se encuentra fácilmente que es s =3, t = ł. Por tanto, el punto de inter- 
sección es 
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Figura 2.3 


Dos rectas que se intersectan 


x 1 1 2 
»y|=| oļ+3i]=]; 
z =1 1 z 


Vea la figura 2.3. (Compruebe que al sustituir t = $ en la otra ecuación produce el mismo 
punto.) 


Comentario En R’, es posible que dos rectas se intersecten en un punto, que sean 
paralelas o ninguna de las dos. Las rectas no paralelas que no se intersectan se llaman rec- 
tas alabeadas. 


Se vio que todo sistema de ecuaciones lineales no tiene soluciones tiene una solución 
única o tiene un número infinito de soluciones. Sin embargo, hay un tipo de sistema que 
siempre tiene al menos una solución. 


Definición Un sistema de ecuaciones lineales se denomina homogéneo si el tér- 
mino constante en cada ecuación es cero. 


En otras palabras, un sistema homogéneo tiene una matriz aumentada de la forma 
[A | 0]. El siguiente sistema es homogéneo: 


2x +3y= z=0 
=x F 5y+22=0 


Dado que un sistema homogéneo no puede no tener solución (¡disculpe la doble nega- 
ción!), tendrá o una solución única (a saber, la solución cero o trivial) o un número in- 
finito de soluciones. El siguiente teorema dice que el último caso debe ocurrir si el nú- 
mero de variables es mayor que el número de ecuaciones. 


Teorema 2.3 


Si [A | 0] es un sistema homogéneo de m ecuaciones lineales con n variables, donde 
m < n, entonces el sistema tiene un número infinito de soluciones. 


Demostración Dado que el sistema tiene al menos la solución cero, es consistente. 
Además, rank(A) = m (¿por qué?). Por el teorema del rank se tiene 


número de variables libres = n — rank(4) =n —m>0 


De modo que existen al menos una variable libre y, por tanto, un número infinito de so- 
luciones. — — 


Nota El Teorema 2.3 no dice algo acerca del caso donde m = n. El ejercicio 44 le 
pide dar ejemplos para demostrar que, en este caso, puede haber una solución única o 
un número infinito de soluciones. 


R y Z, son ejemplos de campos. El 
conjunto de los números raciona- 
les Q y el conjunto de los números 
complejos C son otros ejemplos. 
Los campos se estudian con detalle 
en los cursos de álgebra abstracta. 
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Sistemas lineales sobre E, 


Hasta el momento, todos los sistemas lineales encontrados involucraron números reales, 
y en concordancia las soluciones han sido vectores en algún R”. Se vio cómo surgen otros 
sistemas numéricos, notablemente Z,. Cuando p es un número primo, Z, se comporta 
en muchas aspectos como R; en particular, es posible sumar, restar, multiplicar y dividir 
(por números distintos de cero). Por ende, también pueden resolverse sistemas de ecua- 
ciones lineales cuando las variables y coeficientes pertenecen a algún Z,. En tal caso, se 
hace referencia a resolver un sistema sobre Z. 

Por ejemplo, la ecuación lineal x, + x, + x, = 1, cuando se ve como una ecuación 
sobre Z,, tiene exactamente cuatro soluciones: 


X 1 X 0 X 0 X 1 
x|=|0| |x|=|1|,|x.|=|0 y Xx|=| 1 
X3 0 X3 0 X3 1 X3 1 

(donde la última solución surge porque 1 + 1 + 1 = 1 en Z,). 
X 


Cuando la ecuación x, + x, + x, = 1 se ve sobre Z,, las soluciones | x, | son 


X3 
1 0 0 0 2 1 1 2 
0 > > 0 > > 2 > > 1 > 2 , 1 
0 0 1 2 2 1 


(Compruebe esto.) 
Pero no es necesario usar métodos de ensayo y error; la reducción por renglones de 
las matrices aumentadas funciona igual de bien sobre Z, que sobre R. 


Ejemplo 2.16 


Resuelva el siguiente sistema de ecuaciones lineales sobre Z,. 


xi t2% +t x=0 
Xx + xa=2 
X% +2x=1 


Solución La primera cosa a notar en ejemplos como este es que no se necesitan resta y 
división; puede lograr los mismos efectos al usar suma y multiplicación. (Sin embargo, 
esto requiere que comience a trabajar sobre Z,, donde p es un primo; vea el ejercicio 60 
al final de esta sección y el ejercicio 57 en la sección 1.1.) 

Reduzca por renglones la matriz aumentada del sistema y use cálculos en módulo 3. 


1.2 1/0 2 0 
R,+2R; 
10 112 [=> [0 0|2 
0 1 2|1 0 1 2|1 
RIR 0 2 
R+2R 
0 2 


84 


Capítulo 2 Sistemas de ecuaciones lineales 


R+R |1 0 0|1 
0|2 


2R; 
23 JO 1 


Por tanto, la solución es x, = 1,x, = 2, x; = 1. 


Ejemplo 2.17 


Resuelva el siguiente sistema de ecuaciones lineales sobre Z,: 


x t x + x + x= 
a = 
Xx, F X3 = 


% F x= 


=. oOo O me m 


X + xy = 


Solución La reducción por renglones procede del modo siguiente: 


l1 1 1 11 1 1 
1 1 O 0|[|I|2R+R|0 0 
R;+R; 

0 1 1 0[0[“ [0 1 
0 0 1 1/0 0 0 
1 0 0 1]|1 o 1 

RƏR 1 0 

2. + | 0. 1 

BRO 0 

— 

0 0 

0 0 

1 0 

R+R |O 1 

Ri+R; 

0 0 

0 0 

0 0 

Por tanto, se tiene 

X +x=1 

X + xy = 

X TF x= 


Al hacer la variable libre x, = t produce 


O. a. a O 


O on oso 


= = a ap 


Oh. =. .O m. 


OO m. eme me 


O POr me 


O O O O m 
ESS 


D O- -OGO O l 


D DO © O m= 


EE 
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Xx; LFF 1 1 
Xz t 0 1 
= = Ft 
X3 t 0 1 
Xa t 0 1 


Dado que t puede tomar los dos valores 0 y 1, existen exactamente dos soluciones: 


and 


ooo 
= AO 


e 


Comentario Para sistemas lineales sobre Z, nunca puede haber un número infinito 
de soluciones. (¿Por qué no?) En vez de ello, cuando hay más de una solución, el número de 
soluciones es finito y es función del número de variables libres y p. (Vea el ejercicio 59.) 


Ejercicios 2.2 


En los ejercicios 1-8, determine si la matriz dada está en forma 


0 0 1 
escalonada por renglones. Si lo está, indique si también está en 9% l0 1 1 10. E A 
forma escalonada reducida por renglones. 11 1 4 
1 0 1 7 0 1 0 
1.0 0 3 2.0 1 -1 4 
0 1 0 0 0 0 0 3 5 
2 —4 -2 6 
PNN 1.|5 -2 12 
AD 3 -6 256 
3. 4.|0 0 0 2 4 
0 0 0 1 
0.0.0 
sl O0 00) j0 TO 13.|2 -1 -1 14. | 3 -9 10 
015 01 100 4 a3 A 1-3 3 
L23 2 1 3 5 
7. 10 0 8. 90 l =l 15. Invierta las operaciones elementales con renglones usadas 
0 1 1l 0 0 0 3 en el ejemplo 2.9 para demostrar que puede convertir 
0 0 1 000 0 


2 —4 -4 5 


A a =1 10 9g =5 
En los ejercicios 9-14, use operaciones elementales con renglo- 


nes para reducir la matriz dada a (a) forma escalonada por 
renglones y (b) forma escalonada reducida por renglones. 


en 


O O O m. 
© 
he 
= 
l 
fa 
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1 2 —4 -4 5 
2 4 0 0 2 
2 3 2 1 5 
=] 1 3 6 5 


16. En general, ¿cuál es la operación elemental con renglo- 
nes que “deshace” cada una de las tres operaciones ele- 
mentales con renglones R; <> R, kR; y R; + kR} 


En los ejercicios 17 y 18, demuestre que las matrices dadas son 
equivalentes por renglones y encuentre una secuencia de opera- 
ciones elementales con renglones que convertirán A en B. 


1 2 J =l 
mam! Lam]? =] 
3 4 1 0 

2 0 -1 > 1 =1 

18.4 = 1 1 0O|LB=|3 5 1 

=1. i 1 2 2 0 


19. ¿Qué está mal con la siguiente “demostración” de que 
toda matriz con al menos dos renglones es equivalente 
por renglones a una matriz con un renglón cero? 


Realice R, + R, y R, + R, Ahora los renglones 1 y 2 
son idénticos. Ahora realice R, — R, para obtener un 
renglón de ceros en el segundo renglón. 


20. ¿Cuál es el efecto neto de realizar la siguiente secuencia 
de operaciones elementales con renglones sobre una 
matriz (con al menos dos renglones)? 


R, + R, R 7 R» R + R, Ri 


21. Los estudiantes frecuentemente realizan el siguiente tipo 
de cálculo para introducir un cero en una matriz: 


| n Al 
—> 
2 4 o 10 


Sin embargo, 3R, — 2R; no es una operación elemental 
con renglones. ¿Por qué no? demuestre cómo lograr el 
mismo resultado usando operaciones elementales con 
renglones. 


3 2 
22. Considere la matriz A = | i 2] . Demuestre que 


cualquiera de los tres tipos de operaciones elementales 
con renglones puede usarse para crear un 1 pivote en la 
parte superior de la primera columna. ¿Cuál prefiere y 
por qué? 

23. ¿Cuál es el rank de cada una de las matrices en los ejer- 
cicios 1-8? 

24. ¿Cuáles son las posibles formas escalonadas reducidas 
por renglones de las matrices de 3 X 3? 


En los ejercicios 25-34, resuelva el sistema de ecuaciones dado 
usando eliminación gaussiana o de Gauss-Jordan. 
25. xı + 2x, — 3x3 = 9 26. x + 2y = -1 

2x A+ x=0 2x+ yp+z= 1 


4 nat x3=4 ET y= =m 


27. x—3x,=—2x=0 
=x 2%) + x=0 
2x, + 4x, + 6x, = 0 


28. 3w + 3x + y =] 
2W+ x+y+z=1 
2W+3x+y=z=2 

29.2r+ s= 3 
4r+ s= 7 
2r + 5s = —1 

30. —x, + 3x, — 2x3 + 4x, = 2 

2x = =1 


xı — 3x, + 4x3 — 8x, = —4 


2%, = 6%, + x= 


31.3x, d+ w= =b = 2 
$ +30 -34 + %=-l 
Ex = 2a — 4x; = 8 

32. V2x+y+ 2z= 1 

y2y= 3z= -V2 
=y + V2z = 1 


33.w+x+2y+z= 1 
w=x= ytz= 0 


x+ y ==1 

wW+x +z= 2 
34 a+ b+ c+ d=10 
a+2b+ 3c+ 4d= 30 


a+ 3b+ 6c + 10d = 65 
a+4b+ 8c+ 15d = 93 


En los ejercicios 35-38, determine por inspección (esto es: sin 
realizar cálculo alguno) si un sistema lineal con la matriz au- 
mentada dada tiene una solución única, un número infinito 
de soluciones o ninguna solución. Justifique sus respuestas. 


0 0 1/2 2 0 1| 1 
35.|0 1 3|1 36.| 1 2 =3 A |=1 
1 0 1|1 2 4 —6 2| 0 
1 2 3 4/0 1 2 3 4 5ļj6 
37.|5 6 7 . 80 38.|6 5 4 3 2|1 
9 10 11 12]/0 7 T T T- T7 


12. Demuestre que, si ad — bc + 0, entonces el sistema 


ax + by= r 
cx + dy = s 


tiene una solución única. 
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En los ejercicios 40-43, ¿para qué valor(es) de k, si hay alguno, (c) Proporcione un ejemplo de tres planos, exactamente 
los sistemas tendrán (a) ninguna solución, (b) una solución dos de los cuales son paralelos (figura 2.6). 
única y (c) un número infinito de soluciones? 
40.kx+ y=-2 41. x+ky=1 
2x-2y= 4 kx+ y=1 
42. x+ y+ z=2 43. x+ y+kz= 1 
x+4y= z=k x+ky+ z= 1 
2x= y+4z=Kk k+ y+ z2=-2 
44. Proporcione ejemplos de sistemas homogéneos de m 
ecuaciones lineales con n variables con m = n y con Figura 2.6 


m > n que tengan (a) un número infinito de soluciones 
y (b) una solución única. (d) Proporcione un ejemplo de tres planos que se inter- 
secten en un solo punto (figura 2.7). 
En los ejercicios 45 y 46, encuentre la recta de intersección de 
los planos dados. 
45.3x+2y+z=-=1 y 2x-—y+4z=5 
46.4x+y=z=0 y 2x—y+3z=4 
47. (a) Proporcione un ejemplo de tres planos que tengan 
una recta de intersección común (figura 2.4). 


Figura 2.7 


En los ejercicios 48 y 49, determine si las rectas x = p + su y 
x = q + ty se intersectan y, si lo hacen, encuentre su punto de 


intersección. 
=1 2 1 =1 
48. p = 21q=|2|)u= 2 |,v= 1 
Figura 2.4 1 0 -1 0 
(b) P ione ejemplos de tres pl int > i f A 
one ejemplos de tres planos que se inter- 
OE n p anos qu 4W9.p=|1Lq=| 11 u=|0|v=13 
secten en pares, pero que no tengan un punto 
común de intersección (figura 2.5). 0 m1 1 l 
1 1 2 
50. Sean p = | 2 |, u= l[|yv=|1|. Describa 
3 -1 0 


todos los puntos Q = (a, b, c) tales que la recta a través 
de Q con vector director v intersecta la recta con la 
ecuación x = p + su. 


51. Recuerde que el producto cruz de dos vectores u y v es 
un vector u X v que es ortogonal tanto a u como a v. 
(Vea la Exploración: “el producto cruz” en el capítulo 1.) 
Si 


Figura 2.5 
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demuestre que existe un número infinito de vectores 


52. 


que simultáneamente satisfacen ux =0yv:*x=0 
y que todos son múltiplos de 


U,V3 — U3V, 

u X v= | uv — uv 

UV — UY 

1 0 2 
Seanp = |1 |,q = 1lju=]|-3|yv= 6 
0 =] 1 =] 


Demuestre que las rectas x = p + su y x = q + tv son 
rectas oblícuas. Encuentre las ecuaciones vectoriales de 
un par de planos paralelos, uno que contenga a cada 
recta. 


En los ejercicios 53-58, resuelva los sistemas de ecuaciones li- 
neales sobre el Z, indicado. 


53. x + 2y = 1 sobre Z, 
IF y2 
54.x + y = 1 sobre Z, 
y+z=0 


$ +z=1 


55. 


56. 


57. 


58. 


59. 


60. 


x+y = 1 sobre Z, 
y+z=0 
x +z=l 
3x + 2y = 1 sobre Z; 
x+4y=1 
3x + 2y = 1 sobre Z, 
x+4y=1 
Xx; + 4x, = 1 sobre Z; 
x + 2x, + 4x; 3 
2x, + 2x, + x=1l 
Xx + 3x3 =2 
Demuestre el siguiente corolario del teorema del rank: 


sea A una matriz de m X n con elementos en Z,. Cual- 
quier sistema consistente de ecuaciones lineales con ma- 
triz de coeficientes A tiene exactamente p" "4 solu- 
ciones sobre Z,. 


Cuando p no es primo, se necesita cuidado adicional 
para resolver un sistema lineal (o, de hecho, cualquier 
ecuación) sobre Zo. Con la eliminación gaussiana, re- 
suelva el siguiente sistema sobre Z¿ ¿Qué complicacio- 
nes surgen? 


2x + 3y=4 
4x + 3y=2 


E l 1Ó 


Mentiras que me dice mi computadora 


Las computadoras y calculadoras almacenan números reales en formato de punto flo- 
tante. Por ejemplo, 2001 se almacena como 0.2001 X 10%, y —0.00063 se almacena como 
—0.63 X 10”. En general, el formato de punto flotante de un número es +M X 10%, 
donde k es un entero y la mantisa M es un número real (decimal) que satisface 0.1 < M 
Si 

El número máximo de lugares decimales que pueden almacenarse en la mantisa de- 
penden de la computadora, calculadora o sistema de álgebra computacional. Si el nú- 
mero máximo de lugares decimales que pueden almacenarse es d, se dice que existen d 
dígitos significativos. Muchas calculadoras almacenan 8 o 12 dígitos significativos; las 
computadoras pueden almacenar más, pero todavía está sujeto a un límite. Cualquier dí- 
gito que no se almacene se omite (en cuyo caso se dice que los números están truncados) 
o se usa para redondear el número a d dígitos significativos. 

Por ejemplo, m = 3.141592654, y su formato en punto flotante es 0.3141592654 X 
10'. En una computadora que trunca a cinco dígitos significativos, TT se almacenaría 
como 0.31415 X 10' (y se mostraría como 3.1415); una computadora que redondee a 
cinco dígitos significativos almacenaría m como 0.31416 X 10' (y mostraría 3.1416). 
Cuando el dígito eliminado es un solitario 5, el último dígito restante se redondea, de 
modo que se vuelve par. Por ende, redondeado a dos dígitos significativos, 0.735 se con- 
vierte en 0.74, mientras que 0.725 se convierte en 0.72. 

Siempre que ocurre truncamiento o redondeo, se introduce un error de redondeo, 
que puede tener un efecto dramático sobre los cálculos. Mientras más operaciones se 
realicen, más errores se acumulan. En ocasiones, por desgracia, no hay nada que 
se pueda hacer. Esta exploración ilustra este fenómeno con sistemas muy simples de 
ecuaciones lineales. 


1. Resuelva el siguiente sistema de ecuaciones lineales exactamente (esto es: trabaje 
con números racionales a lo largo de los cálculos). 
x+ y=0 
801, — 
x + 800y =1 


2. Como decimal, $% = 1.00125, de modo que, redondeado a cinco dígitos significa- 


tivos, el sistema se convierte en 
x + y=0 
x + 1.0012y = 1 


Con una calculadora o CAS, resuelva este sistema y redondee el resultado de cada 
cálculo a cinco dígitos significativos. 
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3.  Resuelva el sistema dos veces más, y primero redondee a cuatro dígitos significa- 
tivos y luego a tres dígitos significativos. ¿Qué ocurre? 


4. Claramente, un error de redondeo muy pequeño (menor o igual a 0.00125) 
puede resultar en errores muy grandes en la solución. Explique geométricamente por 
qué. (Considere las gráficas de los diversos sistemas lineales que resolvió en los proble- 
mas 1-3.) 


Los sistemas como el recién trabajado se llaman mal condicionados. Son extremada- 
mente sensibles a errores de redondeo y no hay mucho que se pueda hacer al respecto. 
En los capítulos 3 y 7 se encontrarán nuevamente sistemas mal condicionados. He aquí 
otro ejemplo para experimentar: 


4.552x + 7.083y = 1.931 
1.731x + 2.693y = 2.001 


Juguetee con varias cantidades de dígitos significativos para ver qué ocurre, a partir de 
ocho dígitos significativos (si puede). 


Pivoteo parcial 


En la Exploración “Mentiras que me dice mi computadora”, se vio que los sistemas li- 
neales mal condicionados causan problemas cuando ocurren errores de redondeo. En 
esta exploración descubrirá otra forma en la que los sistemas lineales son sensibles al 
error de redondeo y verá que cambios muy pequeños en los coeficientes pueden condu- 
cir a enormes imprecisiones en la solución. Por fortuna, hay algo que puede hacer para 
minimizar o incluso eliminar este problema (a diferencia del problema con los sistemas 
mal condicionados). 


1. (a) Resuelva la ecuación lineal sencilla 0.00021x = 1 para x. 


(b) Suponga que su calculadora puede acarrear sólo cuatro dígitos significativos. 
La ecuación se redondeará a 0.0002x = 1. Resuelva esta ecuación. 
La diferencia entre las respuestas de los incisos (a) y (b) puede considerarse como 
efecto de un error de 0.00001 en la solución de la ecuación dada. 


2. Ahora extienda esta idea a un sistema de ecuaciones lineales. 
(a) Con eliminación gaussiana, resuelva el sistema lineal 


0.400x + 99.6y = 100 
75.3x — 45.3y = 30.0 


con tres dígitos significativos. Comience por pivotear en 0.400 y lleve cada cálculo 
a tres dígitos significativos. Debe obtener la “solución” x = — 1.00, y = 1.01.Com- 
pruebe que la solución real es x = 1.00, y = 1.00. ¡Este es un error enorme, de 
—200% en el valor de x! ¿Puede descubrir qué lo causó? 


(b)  Resuelva nuevamente el sistema del inciso (a), esta vez intercambiando las 
dos ecuaciones (o, de manera equivalente, los dos renglones de su matriz au- 
mentada) y pivotee en 75.3. De nuevo, lleve cada cálculo a tres dígitos significa- 
tivos. ¿Cuál es la solución esta vez? 

La moraleja de la historia es que, cuando se usa eliminación gaussiana o de Gauss- 
Jordan para obtener una solución numérica de un sistema de ecuaciones lineales (esto 
es: una aproximación decimal), debe elegir el pivote con cuidado. Específicamente, en 
cada paso de pivoteo, elija de entre todos los pivotes posibles en una columna el ele- 
mento con el valor absoluto más grande. Use intercambios de renglones para llevar este 
elemento a la posición correcta y úselo para crear ceros donde se necesite en la columna. 
Esta estrategia se conoce como pivoteo parcial. 


3.  Resuelva los siguientes sistemas mediante eliminación gaussiana, primero sin y 
luego con pivoteo parcial. Lleve cada cálculo a tres dígitos significativos. (Se proporcio- 
nan las soluciones exactas.) 


(a) 0.001x + 0.995y = 1.00 (b) Me = 7 =7 
—10.2x + 1.00y = —50.0 —3x + 2.09y + 6z = 3.91 

5KS va => 0 

X 0.00 
' X 5.00 ; 
Solución exacta: | | = | | Solución exacta: | y | = | —1.00 
y 1.00 

Z 1.00 


Abu Ja far Muhammad ibn Musa 
al-Khwarizmi (c. 780-850) fue un 
matemático persa cuyo libro Hisab 
al-jabr wal muqabalah (c. 825) des- 
cribió el uso de los numerales indo- 
arábigos y las reglas de la aritmética 
básica. La segunda palabra del título 
del libro dio origen a la palabra álge- 
bra, y la palabra algoritmo se deriva 
del nombre de al-Khwarizmi. 


Operaciones de conteo: introducción 
al análisis de algoritmos 


Las eliminaciones gaussiana y de Gauss-Jordan son ejemplos de algoritmos: procedi- 
mientos sistemáticos diseñados para implementar una tarea particular; en este caso, la 
reducción por renglones de la matriz aumentada de un sistema de ecuaciones lineales. 
Los algoritmos son particularmente adecuados para su implementación en computado- 
ras, pero no todos los algoritmos se crean igual. Además de la rapidez, memoria y otros 
atributos del sistema de cómputo en el que corren, algunos algoritmos son más rápidos 
que otros. Una medida de la llamada complejidad de un algoritmo (una medida de su efi- 
ciencia o capacidad para realizar su tarea en un número razonable de pasos) es el nú- 
mero de operaciones básicas que realiza como función del número de variables que se 
ingresan. 

Examine esta proposición en el caso de los dos algoritmos que se tienen para resol- 
ver un sistema lineal: eliminación gaussiana y de Gauss-Jordan. Para este propósito, las 
operaciones básicas son multiplicación y división; se supondrá que todas las otras ope- 
raciones se realizan con mucha más rapidez y pueden ignorarse. (Esta es una suposición 
razonable, mas no se intentará justificarla.) Considere sólo sistemas de ecuaciones con 
matrices de coeficientes cuadradas, de modo que, si la matriz de coeficientes es n x n, el 
número de variables de entrada es n. Por ende, su tarea es encontrar el número de ope- 
raciones realizadas mediante eliminación gaussiana y de Gauss-Jordan como función de 
n. Más aún, no se preocupe por casos especiales que puedan surgir; en vez de ello, esta- 
blezca el peor caso que pueda surgir: cuando el algoritmo tarda tanto como sea posible. 
Dado que esto proporcionará una estimación del tiempo que tardará una computadora 
en realizar el algoritmo (si se sabe cuánto tarda una computadora en realizar una sola 
operación), el número de operaciones realizadas por un algoritmo se denotará T(n). Por 
lo general estará interesado en T(n) para valores grandes de n, de modo que comparar 
esta función para diferentes algoritmos le permitirá determinar cuál tarda menos tiempo 
en ejecutarse. 


1. Considere la matriz aumentada 


24 6ļ|8 
[AJb]=| 3 9 6ļ12 
-1 1 -1|1 
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Cuente el número de operaciones requeridas para llevar [A |b] a la forma escalo- 
nada por renglones 


(Por “operación” se entiende una multiplicación o una división.) Ahora cuente el 
número de operaciones necesarias para completar la fase de sustitución hacia atrás 
de la eliminación gaussiana. Registre el número total de operaciones. 


2. Cuente el número de operaciones necesarias para realizar la eliminación de 
Gauss-Jordan; esto es: reducir [A | b] a su forma escalonada reducida por renglones 


(donde se introducen ceros en cada columna inmediatamente después de crear el 1 pi- 
vote en dicha columna). ¿Qué sugieren sus respuestas acerca de la eficiencia relativa de 
los dos algoritmos? 

Ahora se tratará de analizar los algoritmos en una forma general sistemática. Su- 
ponga que la matriz aumentada [A |b] surge de un sistema lineal con n ecuaciones y n 
variables; por tanto, [A |b] esn X (n + 1): 


an Ay aj |b, 
da My “dz |b, 
[Ay] (TA A 
Ant an E Ann b, 


Suponga que los intercambios de renglón nunca se necesitan, que siempre puede crear 
un 1 pivote a partir de un pivote al dividir entre el pivote. 


3. (a) Demuestre que se necesitan n operaciones para crear el primer 1 pivote: 


Ai An an | bi 1 
da an ` An|b da An `o dy |b, 
An an o Ann b, Anı an o Ann b, 


ə—> (¿Por qué no necesita contar una operación para la creación del 1 pivote?) Ahora de- 
muestre que se necesitan n operaciones para obtener el primer cero en la columna 1: 


0 + + + 
ânı An e Ann b, 
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(¿Por qué no necesita contar una operación para la creación del cero mismo?) Cuando la 
primera columna se ha “barrido”, se tiene la matriz 


0 E EE 
0 E EE 


Demuestre que el número total de operaciones necesarias hasta este punto es n + (n — 
Dn. 


(b) Demuestre que el número total de operaciones necesarias para alcanzar la 
forma escalonada por renglones 


0 1 EJE 


es 
[n + (n— Da] + [(n— 1) + (n — 2)(n — 1)] + [(n — 2) + (n — 3)](n — 2)] 
+o +[2+1-2]+1 
que se simplifica a 
n = L R 


(c) Demuestre que el número de operaciones necesarias para completar la fase 
de sustitución hacia atrás es 


1+2+--+(n-1) 


(d) Con las fórmulas de suma para las sumas en los incisos (b) y (c) (vea los 
ejercicios 51 y 52 de la sección 2.4 y el apéndice B), demuestre que el 
número total de operaciones, T(n), realizadas mediante eliminación gaus- 
siana es 


Dado que cada función polinominal está dominada por su término pivote para valores 
grandes de la variable, se ve que T(n) = 3n para grandes valores de n. 


4. Demuestre que la eliminación de Gauss-Jordan tiene T(n) = in? operaciones 
totales si se crean ceros arriba y abajo del 1 pivote conforme avanza. (Esto demuestra que, 
para sistemas grandes de ecuaciones lineales, la eliminación gaussiana es más rápida que esta 
versión de la eliminación de Gauss-Jordan.) 
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Capítulo2 Sistemas de ecuaciones lineales 


n 


Conjuntos generadores e independencia lineal 


El segundo de los tres caminos en el “trivium” trata con combinaciones lineales de vec- 
tores. Se vio que es posible ver la resolución de un sistema de ecuaciones lineales como 
preguntar si cierto vector es una combinación lineal de otros vectores. Esta idea se ex- 
plora con más detalle en esta sección. Conduce a algunos conceptos muy importantes 
que se encontrarán repetidamente en capítulos posteriores. 


Ahora se puede responder con facilidad la pregunta planteada en la sección 1.1: ¿cuándo 
un vector dado es una combinación lineal de otros vectores dados? 


Ejemplo 2.18 


> 
1 1 —1 
(a) ¿El vector | 2 | es una combinación lineal de los vectores | 0 | y 1)? 
3 3 =3 
2 1 =] 
(b) ¿| 3 [es una combinación lineal de los vectores | 0 | y ES 
4 3 =3 
Solución 


(a) Se quiere encontrar escalares x y y tales que 


1 =l 1 
xlol+y 1|=|2 
3 =3 3 
Al desarrollar, se obtiene el sistema 
> yl 
y=2 
3 =3y= 
cuya matriz aumentada es 
H- =1 4 
0 112 
3 =313 


(Observe que las columnas de la matriz aumentada son sólo los vectores dados; note el 
orden de los vectores, en particular, cuál vector es el vector constante.) 
La forma escalonada reducida de esta matriz es 


O O m= 


013 
1|2 
010 
(Verifique esto.) De modo que la solución es x = 3, y = 2, y la correspondiente combi- 
nación lineal es 


1 =1 1 
30|+2| 1|=|2 
3 
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(b) Al usar la observación del inciso (a), se obtiene un sistema lineal cuya matriz au- 
mentada es 


Ll =112 
0 1/3 
3 -3|4 
que se reduce a 
1 0j 5 
0 1| 3 
0 0|-2 
2 
lo que revela que el sistema no tiene solución. Por tanto, en este caso, | 3 | no es una 
1 =] 4 
combinación lineal de | 0 | y | 1l. 
3 =3 


ll 


La noción de conjunto generador está íntimamente conectada con la solución de sis- 
temas lineales. Revise de nuevo el ejemplo 2.18. Ahí se vio que un sistema con matriz au- 
mentada [A | b] tiene una solución precisamente cuando b es una combinación lineal de 
las columnas de A. Este es un hecho general que se resume en el siguiente teorema. 


Teorema 2.4 


Un sistema de ecuaciones lineales con matriz aumentada [A | b] es consistente si y sólo 
si b es una combinación lineal de las columnas de A. 


Revise nuevamente el ejemplo 2.4 e interprételo a la luz del Teorema 2.4. 


(a) El sistema 
x=y=1 
x+y=3 


tiene la solución única x = 2, y = 1. Por tanto, 
2 + = 
1 1 3 


x= y=2 
2x = 2y=4 


Vea la figura 2.8(a). 


(b) El sistema 


tiene un número infinito de soluciones de la forma x = 2 + t, y = t. Esto implica que 


1 =] 2 
eeoa L 
2 =2 4 
dem 1 =1 2 
para todos los valores de t. Geométricamente, los vectores p! | | y H son todos 


=2 


paralelos y por tanto todos yacen a lo largo de la misma recta que pasa por el origen [vea 
la figura 2.8(b)]. 
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(a) 


Figura 2.8 


| | x | | x 
=2 =l 3 =2 2 3 
=3+ 
(b) 
(c) El sistema 
==> 
== 3 


no tiene soluciones, de modo que no hay valores de x y y que satisfagan 
je sl == 
la] ls 
1 =l 1 à 
En este caso, | a y | B 0 son paralelos, pero A no yace a lo largo de la misma recta que 


pasa por el origen [vea la figura 2.8(c)]. 


Con frecuencia se estará interesado en la colección de todas las combinaciones lineales 
de un conjunto dado de vectores. 


Definición siS = (v,,v,..., v,) es un conjunto de vectores en R”, entonces el 
conjunto de todas las combinaciones lineales de v,, v}, . . . , v, se llama el generador de 
Vp V» - + +, Vg y se denota mediante gen (v,, V» ... ., v,) o gen(S). Si gen (S) = R”, en- 
tonces S se llama conjunto generador de R". 


Ejemplo 2.19 


Demuestre que R? = gen (A 2) 


a K ¿ ¡a an 
Solución Necesita demostrar que un vector arbitrario | 0 puede escribirse como una 
de RS 2 1 . 2 
combinación lineal de lb esto es, debe demostrar que la ecuación x f + 
1 a 
| a = | s| siempre puede resolverse para x y y (en términos de a y b), sin importar los 


valores de a y b. 
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La matriz aumentada es | 2 , | s y la reducción por renglones produce 


| 2 1 d R/ OR, E 3 
— 
=1 31b 2 1 


en cuyo punto es claro que el sistema tiene una solución (única). (¿Por qué?) Si continúa, 
obtiene 


i R,+2R, TZ 3 
—> 


a 
0 7ļa+2b 


a 


IR E 3 
— 
0 1 


(b — i 


b =p 0 
(a + 2b)/7 0 1|(a + 2b)/7 


de donde se ve que x= (3a — b)/7 y y = (a + 2b)/7. Por tanto, para cualquier elección de 


a y b, se tiene 
(2 - 3] >] y (* + 3 z A 
7 =] 7 3 b 
(Compruebe esto.) ! 


2 1 
Comentario También es cierto que R? = sen | ab El 5) si, dado A! 


2 1 a 
puede encontrar x y y tales que l l + 13 = | , entonces también se tiene 


2 1 5 a 
l j | + y J +0 | | = | y! De hecho, cualquier conjunto de vectores que contenga 
un conjunto generador para R? también será un conjunto generador para R? (vea el ejer- 
cicio 20). 

El siguiente ejemplo es un importante caso (sencillo) de un conjunto generador. Mu- 
chas veces encontrará versiones de este ejemplo. 


Ejemplo 2.20 


z 
Sean e,, e, y e, los vectores unitarios estándar en R°’. Entonces, para cualquier vector 


x 
y |, se tiene 
z X 1 0 0 
y| =x 0| +y| 1| +z 0| = xe, + ye, + ze 
z 0 0 1 
Por tanto, R? = gen(e,, e, e,). 
No debe tener dificultad para ver que, en general, R” = gen(e,, e»... €). 


-i 


Cuando el generador de un conjunto de vectores en R” no es todo de R”, es razona- 
ble pedir una descripción del generador de los vectores. 


Ejemplo 2.21 


1 =1 
Encuentre el generador de | 0 | y | 1 |. (Vea el ejemplo 2.18.) 
3 =3 
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Z 


Figura 2.9 
Dos vectores no paralelos generan 
un plano 


Solución Al pensar geométricamente, puede ver que el conjunto de todas las combina- 


1 =1 1 =1 
ciones lineales de | 0 | y| 1 | es justo el plano que pasa por el origen con | 0 |y] 1 
3 =3 3 =3 
como vectores directores (figura 2.9). La ecuación vectorial de este plano es 
x 1 =1 x 
y|=s|0|+t| 1|, que es sólo otra forma de decir que | y | está en el generador 
Z 3 =3 z 
1 =1 
de|O|y| 1 
3 =3 


Suponga que quiere obtener la ecuación general de este plano. Existen muchas for- 
mas de proceder. Una es usar el hecho de que la ecuación ax + by + cz = 0 debe ser sa- 
tisfecha por los puntos (1, 0, 3) y (— 1, 1, —3) determinados por los vectores directores. 
Entonces la sustitución conduce a un sistema de ecuaciones en a, b y c. (Vea el ejercicio 
17.) 

Otro método es usar el sistema de ecuaciones que surgen de la ecuación vectorial: 


s= [= 
t=y 
3s — 3t=z 


Si la matriz aumentada se reduce por renglones, se obtiene 


1 =1 |x l. =I xX 
R;— 3R; 
0 1ly| — 0 1 y 
3 =3/z 0 O [z— 3% 
X 1 


Ahora se sabe que este sistema es inconsistente, pues | y | está en el generador de | 0 |y 
—1 zZ 3 


1 | por suposición. De modo que se debe tener z — 3x = 0, (o 3x — z = 0, en la forma 
=} 
más estándar), lo que da la ecuación general que se busca. 
Comentario Un vector normal al plano en este ejemplo también está dado por el 
producto cruz 


1 =1 =3 
olx] ıļl=]| o0 
3 =3 1 
independencia lineal 
1 =] 1 
En el ejemplo 2.18 se encontró que 3| 0 | + 2| 1| = |2 |. Abrevie esta ecuación 
3 =3 3 


como 3u + 2v = w. El vector w “depende” de u y v en el sentido de que es una combi- 
nación lineal de ellos. Se dice que un conjunto de vectores es linealmente dependiente si 
uno de ellos puede escribirse como una combinación lineal de los otros. Note que tam- 
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.z . 2 1 .z 4 
bién se tiene u = — $v +3 w y v= —ju +3w. Para franquear la cuestión de cuál vec- 
tor expresar en términos del resto, a continuación se enuncia la definición formal: 


Definición Un conjunto de vectores v,, v» . . . , v, es linealmente dependiente si 
existen escalares C,, C,, . . ., C al menos uno de los cuales no es cero, tales que 


Nr No ar 299 > E = 


Un conjunto de vectores que no es linealmente dependiente se llama linealmente in- 
dependiente. 


Comentarios 
+ En la definición de independencia lineal, el requisito de que al menos uno de los 
escalares c,, C,, . .., C debe ser distinto de cero admite la posibilidad de que alguno puede 


ser cero. En el ejemplo anterior, u, v y w son linealmente dependientes, pues 3u + 2v — 
w = 0 y, de hecho, todos los escalares son distintos de cero. Por otra parte, 


AAA 


2 1 
de modo que | al H y H son linealmente dependientes, pues al menos uno (de 
hecho, dos) de los tres escalares 1, —2 y 0 es distinto de cero. (Note que la dependencia 
real surge simplemente del hecho de que los primeros dos vectores son múltiplos.) (Vea 
el ejercicio 44.) 

+ Dado que 0v, + Ov, + *** + Ov, = 0 para cualesquiera vectores V}, V» . . . , Vp la 
dependencia lineal en esencia dice que el vector cero puede expresarse como una combi- 
nación lineal no trivial de v,, V}, . . . , V} Por tanto, independencia lineal significa que el 
vector cero puede expresarse como una combinación lineal de v,, v», . . ., Vp sólo en la 
forma trivial: c,v, + CV, +": + cv, = 0 sólo sic, =0,c,=0,...,c,=0. 


La relación entre la noción intuitiva de dependencia y la definición formal se pro- 
porciona en el siguiente teorema. ¡Felizmente, las dos nociones son equivalentes! 


Teorema 2.5 


Los vectores V}, V» . . ., V„ en R” son linealmente dependientes si y sólo si al menos 
uno de los vectores puede expresarse como una combinación lineal de los otros. 


Demostración Si uno de los vectores, por ejemplo, v, es una combinación lineal de los 
otros, entonces existen escalares c,, . . . , C,, tales que v} = CV, + *** + C,v,,. Al reordenar, 


m m 
se obtiene V, — GV, — *** — €, v,, = 0, lo que implica que v}, V» . .  , V,, son linealmente 
dependientes, pues al menos uno de los escalares (a saber, el coeficiente 1 de v,) es dis- 
tinto de cero. 
Por el contrario, suponga que v,, V» . . . , V,, son linealmente dependientes. Entonces 
existen escalares C}, C» . . - , Cp» no todos cero, tales que civ} + CV, + *** + Cc, v,, = 0. Su- 


m m 
ponga c, + 0. Entonces 


m 
cV = ZOV IE CV in 


y se pueden multiplicar ambos lados por 1/c, para obtener v, como una combinación li- 
neal de los otros vectores: 
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Nota Parece como si se hiciera un poco de trampa en esta demostración. Después 
de todo, no puede estar seguro de que v, es una combinación lineal de los otros vectores, 
ni que c, es distinto de cero. Sin embargo, el argumento es análogo para algún otro vec- 
tor v; o para un escalar c; diferente. Alternativamente, puede reetiquetar las cosas de 
modo que funcionen como en la demostración anterior. En una situación como ésta, un 
matemático puede comenzar por decir, “sin pérdida de generalidad, puede suponer que 
v, es una combinación lineal de los otros vectores” y luego proceder como antes. 


= 
Ejemplo 2.22 Cualquier conjunto de vectores que contenga el vector cero es linealmente dependiente. 
Pues si 0, v,, . . . , v,, están en R”, entonces puede encontrar una combinación no trivial 


de la forma c,0 + cv, + ++: + Cp Yp = 0 al hacer c, =1yc,=cC, e c 0. 


m 


mE 


Ejemplo 2.23 


> 
Determine si los siguientes conjuntos de vectores son linealmente independientes: 


i 1 0 1 
(a) AN J œ lıllılylo 
0 1 1 
1 0 =f 1 1 1 
(e) | =1 |, ly 0 (d) |2), 1j y]4 
0 =] 1 0 =i 2 


Solución Al responder cualquier pregunta de este tipo, es buena idea ver si puede de- 
terminar por inspección si un vector es una combinación lineal de los otros. ¡Pensar un 
poco puede ahorrar muchos cálculos! 


(a) La única forma en que los dos vectores pueden ser linealmente dependientes es si 
uno es múltiplo del otro. (¿Por qué?) Claramente, estos dos vectores no son múltiplos, de 
modo que son linealmente independientes. 


(b) No hay aquí una relación de dependencia obvia, así que se tratará de encontrar es- 
calares c,, €, Cc, tales que 


1 0 1 0 
ajl|+co l1|+cojo0|=]|0 
0 1 1 0 


El sistema lineal correspondiente es 


c+ G=0 
at =0 
Gto =0 
y la matriz aumentada es 
1 0 10 
1 1 0jo0 
0 1 10 


Una vez más, se hace la observación fundamental de que ¡las columnas de la matriz de 
coeficientes son justo los vectores en cuestión! 
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La forma escalonada reducida por renglones es 
1 0 0/0 
0 1 0j0 
0 0 10 
(compruebe esto), de modo que c, = 0, c, = 0, c = 0. Por tanto, los vectores dados son 


linealmente independientes. 
(c) Un poco de reflexión revela que 


1 0 -1 0 
1|+| 1|+| o|=]o0 
0 -1 1 0 


de modo que los tres vectores son linealmente dependientes. [Establezca un sistema li- 
neal como en el inciso (b) para comprobar esto algebraicamente.] 


(d) Una vez más, no se observa dependencia obvia, así que se procede directamente a re- 
ducir un sistema lineal homogéneo cuya matriz aumentada tiene como sus columnas los 
vectores dados: 


RER 
1 1 10 bai 1 L 1/0 e 1 0 310 
2 1 4|0| —>|0 —1 2]|0 d 0 1 —2]|0 
0 -1 2]0 0 -1 2]0 Loo ofo 
Si se hace que los escalares sean C}, C, y Cy, se tiene 
G + 3c = 0 
G&G — 26 = 0 


de donde se ve que el sistema tiene un número infinito de soluciones. En particular, debe 
haber una solución distinta de cero, de modo que los vectores dados son linealmente de- 
pendientes. 

Si continúa, puede describir estas soluciones exactamente: c, = —3c, y c, = 2c,. Por 
tanto, para cualquier valor distinto de cero de c,, se tiene la relación de dependencia li- 
neal 


1 1 1 0 
=36| 2 | +20] 1|+c|4|=]|0 
0 =1 2 0 
(Una vez más, compruebe que esto es correcto.) E: 


Este procedimiento se resume para probar la independencia lineal como teorema. 


Teorema 2.6 


Sean V}, Vz + + +» V,, vectores (columna) en R” y sea A la matriz de n X m [v, v, +: * 
y, ] con dichos vectores como sus columnas. Entonces v}, V», . . . , V,, son linealmente 
dependientes si y sólo si el sistema lineal homogéneo con matriz aumentada [A | 0] 
tiene una solución no trivial. 


Demostración  v,,v,,..., v,, son linealmente dependientes si y sólo si existen escalares 
Cp C» » - -> €, DO todos cero, tales que cv, + cV, + *** + c,v,, = 0. Por el Teorema 2.4, 
c 


A A cm C) mm A 
esto es equivalente a decir que el vector distinto de cero | | es una solución del sis- 


tema cuya matriz aumentada es [v, v, ++: v„ | 0]. ù O ë J 


m 
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| > 
Ejemplo 2.24 | Los vectores unitarios estándar e, e, y e, son linealmente dependientes en R°, pues el sis- 
tema con matriz aumentada [e, e, e, | 0] ya está en la forma escalonada reducida por ren- 


glones 

1 0 0/0 

0 1 0/0 

0 0 1]0 
y por tanto claramente sólo tiene la solución trivial. En general, se ve que e}, €,,..., €, 
serán linealmente independientes en R”. pe 


Al realizar operaciones elementales con renglones sobre una matriz se construyen 
combinaciones lineales de los renglones. Puede usar este hecho para encontrar otra 
forma de probar la independencia lineal para vectores. 


Ejemplo 2.25 Considere los tres vectores del ejemplo 2.23(d) como vectores renglón: 
[1, 2, 0], [1, 1,-1] y [1, 4, 2] 


Construya una matriz con estos vectores como sus renglones y proceda a reducirla a 
forma escalonada. Cada vez que cambia un renglón, el nuevo renglón se denota al agre- 
gar un símbolo de prima: 


1.2 0 1 2 0 1 2 0 
R,=R,-R;, RZ =R}; +2R; 

1 1 r|. = 0 -= =] =} 0 =1 =l 
R3=R;-R; 

1 4 2 0 2 2 0 0 0 


A partir de esto se ve que 
0 = R; = R + 2R} = (R; — R) + AR, — R) = -3R, + 2R, + R, 
o, en términos de los vectores originales, 
-3[1,2,0] + 2[1, 1, —1] + [1, 4,2] = [0, 0, 0] 


[Note que este planteamiento corresponde a tomar c, = 1 en la solución del ejemplo 


2.23(d).] 


Por tanto, los renglones de una matriz serán linealmente dependientes si pueden 
usarse operaciones elementales con renglones para crear un renglón cero. Este hallazgo 
se resume del modo siguiente: 


Teorema 2.7 vı 
va 

Sean V}, V» . . . , V„ vectores (renglón) en R” y sea A la matriz de mXn | : | con 
Vin 

dichos vectores como sus renglones. Entonces v,, V» . . ., V,, son linealmente depen- 


dientes si y sólo si rango(A) < m. 


Demostración Suponga que v,, V» . . . , V,, son linealmente dependientes. Entonces, por 
el Teorema 2.2, al menos uno de los vectores puede escribirse como una combinación li- 
neal de los otros. Reetiquete los vectores, si es necesario, de modo que pueda escribir v, 
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= QV + CV, + + €, ¡V,-¡ Entonces las operaciones elementales con renglones R, 


= Q&Rp Rm — CR». Ry — Cp-¡Rp-1 aplicadas a A crearán un renglón cero en el ren- 
glón m. Por tanto, rango(A) < m. 

Por el contrario, suponga que rango(A) < m. Entonces existe alguna secuencia 
de operaciones con renglones que crearán un renglón cero. Puede usar un argumento de 
sustitución sucesiva análogo al que se utilizó en el ejemplo 2.25 para demostrar que 0 es 
una combinación lineal no trivial de v}, V}, . . ., v,, Por tanto, V}, V» . . ., V,, son lineal- 


mente dependientes. — A 


En algunas situaciones, puede deducir que un conjunto de vectores es linealmente 
dependiente sin hacer trabajo alguno. Una de tales situaciones es cuando el vector cero 
está en el conjunto (como en el ejemplo 2.22). Otra es cuando hay “demasiados” vecto- 
res para que sean independientes. El siguiente teorema resume este caso. (En el capítulo 6 
se verá una versión más precisa de este resultado.) 


Teorema 2.8 


Cualquier conjunto de m vectores en R” es linealmente dependiente si m > n. 


Demostración Sean v,, v», . . ., V,„ vectores (columna) en R” y sea A la matriz n X m 
[v, v, *** v,,] con dichos vectores como sus columnas. Por el Teorema 2.6, V,, Va . . ., V,, 
son linealmente dependientes si y sólo si el sistema lineal homogéneo con matriz au- 
mentada [A | 0] tiene una solución no trivial. Pero, de acuerdo con el Teorema 2.6, este 
siempre será el caso si A tiene más columnas que renglones; es el caso aquí, pues el nú- 
mero de columnas m es mayor que el número de renglones n. — A 


Ejemplo 2.26 


Ejercicios 2.3 


> 


1 2 3 
Los vectores l | > | 2] y | A son linealmente dependientes, pues no pueden existir más 
de dos vectores linealmente independientes en R?. (Note que si quiere encontrar la rela- 
ción de dependencia real entre estos tres vectores, debe resolver el sistema homogéneo 
cuya matriz de coeficientes tenga los vectores dados como columnas. ¡Hágalo!) 


En los ejercicios 1-6, determine si el vector v es una combina- 1 1 0 
ción lineal de los vectores restantes. 


l.v 


1 
2 u=|0 
e l 
2.2 1.0 2.4 
48 6v= 4.0 |,u, = 0.5|,m=|1.2|, 
=2,2 0.5 3:1 
12 
u=|-2.3 
4.8 
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En los ejercicios 7 y 8, determine si el vector b está en el gene- 
rador de las columnas de la matriz A. 


cal Jo] 


1 2 3 10 
8.A=|4 5 6|,b=|11 
7 8 9 12 
1 1 
9. Demuestre que R? = SH! w 
2 =] 
10. Demuestre que R? = eea( | 2L] i 
1 1 0 
11. Demuestre que R? = gen| | 0 |,| 1|,| 1 
1 0 1 
1 1] f=t 
12. Demuestre que R? = gen| | 1 |,| 1|| 1 
1 =] 1 


En los ejercicios 13-16, describa el generador de los vectores 
dados (a) geométricamente y (b) algebraicamente. 


AA 


1 3 1 =1 0 
15.|2|, 2 16. 0 |, L jy =i 
0 =l =| 0 1 


17. La ecuación general del plano que contiene los puntos 
(1, 0, 3), (— 1, 1, —3) y el origen es de la forma ax + by 
+ cz = 0. Resuelva para a, b y c. 


18. Demuestre que u, v y w están todos en gen(u, v, w). 


19. Demuestre que u, v y w están todos en gen(u, u + v, 
u+v+w). 


20. (a) Demuestre que si u}, . . . , u„ son vectores en R”, 
S=(u,0),..., uh y 7 =(0,..., Up Ugg p.e > Up 
entonces; gen(S) C gen(T). [Sugerencia: vuelva a escri- 
bir esta ecuación en términos de combinaciones linea- 
les.] 

(b) Deduzca que, si R" = gen(S), entonces R” = 
gen(T) también. 


21. (a) Suponga que el vector w es una combinación lineal 
de los vectores u4, . . . , u, y que cada u; es una com- 


binación lineal de los vectores v}, . . . , V,„„, Demues- 
tre que w es una combinación lineal de v,,..., v,,, y 
por tanto gen(u,,...,u;,) C gen(v,,..., V,,). 


(b) En el inciso (a), suponga además que cada v; tam- 
bién es una combinación lineal de u,,..., u,. De- 
muestre que u,,...,u,) = gen(v,...,V,,). 

(c) Use el resultado del inciso (b) para demostrar que 


1 1 1 
R?=gen| |0|,|11|,11 
0 0 1 


[Sugerencia: Se sabe que R? = gen(e,, e,, e,).] 


Use el método del ejemplo 2.23 y el Teorema 2.6 para determi- 
nar si los conjuntos de vectores en los ejercicios 22-31 son 
linealmente independientes. Si, para alguno de ellos la res- 
puesta puede determinarse por inspección (esto es, sin cálculo), 
establezca por qué. Para cualquier conjunto que sea lineal- 
mente dependiente, encuentre una relación de dependencia 
entre los vectores. 


3 -2 1 1 1 
22; Tj; 1 23, | T15 2 |, | =1 
4 =1 1 3 2 
3 2 1 0 2 2 
al; ad EÈ j; ] 23 | Li 11, ] 
2 3 =6 2 3 1 
2 =D 4 3 3 6 0 
a| ; |; sil 27.141,17 1, | 
7 1 0 5 5 8 0 
1 2 3 
3 4 2 
0 5 4 
1 =] 1 0 
1 0 1 =1 
0 =] 1 
0 0 0 4 
0 2 2 2 
1 1 1 1 
3 = 1 =] 
31. =:] 3 , E, =] 
1 1 3 1 
ad —]l 1 3 


En los ejercicios 32-41, determine si los conjuntos de vectores 
en el ejercicio dado son linealmente independientes al conver- 
tir los vectores a vectores renglón y usar el método del ejemplo 
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2.25 y el Teorema 2.7. Para cualquier conjunto que sea lineal- (b) Si los vectores u, v y w son linealmente indepen- 
mente independiente, encuentre una relación de dependencia dientes, ¿u — v, v — w y u — w también son lineal- 
entre los vectores. mente independientes? Justifique su respuesta. 
32. Ejercicio 22 33. Ejercicio 23 44. Demuestre que dos vectores son linealmente dependien- 
34. Fjercicio 24 35. Ejercicio 25 tes si y sólo si uno es un múltiplo escalar del otro. [Suge- 
Poet pe rencia: considere por separado el caso en que uno de los 
36. Ejercicio 26 37. Ejercicio 27 P P q 
vectores es 0.] 
38. Ejercicio 28 39. Ejercicio 29 se % NS 
) ) 45. Ofrezca una “demostración de vector renglón” del Teo- 
40. Ejercicio 30 41. Ejercicio 31 rema 2.8. 
42. (a) Si las columnas de una matriz A de n X n son lineal- 46. Demuestre que todo subconjunto de un conjunto linal- 
: ; Aen , ; , > A 
mente independientes como vectores en R”, ¿cuál es mente independiente es linealmente independiente. 
el rank de A? Explique. ; 
; ; ; 47. Suponga que S = (v,,..., Vp V} es un conjunto de vec- 
(b) Silos renglones de una matriz A de n X n son lineal- A A A 
i p i tores en algún R” y que v es una combinación lineal de 
mente independientes como vectores en R”, ¿cuál es Ea) 
Vp -eeo Vg SiS' = [v,,..., v,), demuestre que gen(S) = 


3 A 
el fank de.A? Explique; gen(S'). [Sugerencia: el ejercicio 21(b) es útil aquí.] 
43. (a) Silos vectores u, v y w son linealmente independientes, 


¿u + v, v + wyu + w también son linealmente in- 
dependientes? Justifique su respuesta. 


48. Sea [v,,...,v,) un conjunto linealmente independiente 
de vectores en [R” y sea v un vector en R”. Suponga que 
v= cV + cV, +." + c¿v, conc, + 0. Pruebe que 
[v, v,, . . > v,) es linealmente independiente. 


mn Aplicaciones 


Existen demasiadas aplicaciones de los sistemas de ecuaciones lineales para hacerles jus- 
ticia en una sola sección. Esta sección presentará algunas aplicaciones para ilustrar la di- 
versidad de escenarios en que surgen. 


Una gran cantidad de aplicaciones de los sistemas de ecuaciones lineales involucran asig- 
nar recursos limitados sujetos a un conjunto de restricciones. 


Ejemplo 2.27 Una bióloga colocó tres cepas de bacterias (denominadas I, II y II) en un tubo de en- 
sayo, donde se alimentarán de tres diferentes fuentes alimenticias (A, B y C). Cada día, 
2300 unidades de A, 800 unidades de B y 1500 unidades de C se colocan en el tubo de en- 
sayo y cada bacteria consume cierto número de unidades de cada alimento por día, 
como se muestra en la tabla 2.2. ¿Cuántas bacterias de cada cepa pueden coexistir en el 
tubo de ensayo y consumir todo el alimento? 


Tabla 2.2 
Bacteria Bacteria Bacteria 
cepa I cepa II cepa III 
Alimento A 2 2 4 
Alimento B 1 2 0 


Alimento C 1 3 1 
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Solución Sean x,, x, y x; los números de bacterias de las cepas I, II y HI, respectiva- 
mente. Dado que cada una de las bacterias x, de la cepa I consumen 2 unidades de A por 
día, la cepa I consume un total de 2x, unidades por día. De igual modo, las cepas II y II 
consumen un total de 2x, y 4x, unidades de alimento A diariamente. Puesto que se 
quiere consumir las 2300 unidades de A, se tiene la ecuación 


2x, + 2x, + 4x, = 2300 
Del mismo modo, se obtienen ecuaciones correspondientes para el consumo de B y C: 


xi + 2x, = 800 
xı + 3x, + x; = 1500 


Por tanto, se tiene un sistema de tres ecuaciones lineales con tres variables. La reducción 
por renglones de la matriz aumentada correspondiente produce 


2 2 4|2300 1 0 0/100 
1 2 0| 800| —>|0 1 0|350 
1 3 1|1500 0 0 1|350 


En consecuencia, x, = 100, x, = 350 y x, = 350. La bióloga debe colocar 100 bacterias 
de cepa I y 350 de cada una de las cepas II y II en su tubo de ensayo si quiere que consu- 


man todo el alimento. 


Ejemplo 2.28 


z 
Repita el ejemplo 2.27 y use los datos de consumo diario de alimento (unidades por día) 
que se muestran en la tabla 2.3. Suponga esta vez que en el tubo de ensayo se colocan dia- 
riamente 1500 unidades de A, 3000 unidades de B y 4500 unidades de C. 


Tabla 2.3 
Bacteria Bacteria Bacteria 
cepa I cepa II cepa III 
Alimento A 1 1 1 
Alimento B 1 2 3 
Alimento C 1 3 5 


Solución Sean nuevamente x, x, y x, los números de bacterias de cada tipo. La matriz 
aumentada para el sistema lineal resultante y la correspondiente forma escalonada redu- 
cida son 


1 1 1|1500 1.00 -1 0 
1 2 3|3000| —>|0 1 2|1500 
1 3 5|4500 0.0 0 0 


Se ve que, en este caso, se tiene más de una solución, dadas por 
Xx -= x= 0 
x, + 2x3 = 1500 


Al hacer x, = t, se obtiene x, = t, x, = 1500 — 2t y x, = t. En cualquier problema de apli- 
cación, debe tener cuidado de interpretar adecuadamente las soluciones. Ciertamente el 
número de bacterias no puede ser negativo. Por tanto, t = 0 y 1500 — 2t = 0. La última 
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desigualdad implica que t < 750, de modo que se tiene 0 < t < 750. Presumiblemente, 
el número de bacterias debe ser un número entero, de modo que existen exactamente 
751 valores de t que satisfacen la desigualdad. Por ende, las 751 soluciones son de la 
forma 


X t 0 1 
x, | = | 1500 — 2t| = | 1500 | + t| —2 
X3 t 0 1 


una para cada valor entero de t tal que 0 = t <= 750.(De este modo, aunque matemática- 
mente este sistema tiene un número infinito de soluciones, físicamente sólo existe un nú- 


mero finito.) | 


Cuando ocurre una reacción química, ciertas moléculas (los reactivos) se combinan para 
formar nuevas moléculas (los productos). Una ecuación química balanceada es una 
ecuación algebraica que proporciona los números relativos de reactivos y productos en 
la reacción, y tiene el mismo número de átomos de cada tipo en los lados izquierdo y de- 
recho. La ecuación usualmente se escribe con los reactivos a la izquierda, los productos a 
la derecha y una flecha entre ellos para mostrar la dirección de la reacción. 

Por ejemplo, para la reacción en la que se combinan gas hidrógeno (H,) y oxígeno 
(O,) para formar agua (H,O), una ecuación química balanceada es 


2H, + O, — 2H,O 


que indica que dos moléculas de hidrógeno se combinan con una molécula de oxígeno 
para formar dos moléculas de agua. Observe que la ecuación está balanceada, pues exis- 
ten cuatro átomos de hidrógeno y dos átomos de oxígeno en cada lado. Note que nunca 
habrá una sola ecuación balanceada para una reacción, pues cualquier múltiplo entero 
positivo de una ecuación balanceada también lo estará. Por ejemplo, 6H, + 30, —> 
6H,O también está balanceada. Por tanto, por lo general se busca la ecuación balanceada 
más simple para una reacción dada. 

Aunque frecuentemente ensayo y error funcionan en los ejemplos simples, el pro- 
ceso de balancear ecuaciones químicas en realidad involucra resolver un sistema homo- 
géneo de ecuaciones lineales, de modo que pueden usarse las técnicas desarrolladas para 
remover las conjeturas. 


> 


Ejemplo 2.29 


La combustión de amoniaco (NH,) en oxígeno produce nitrógeno (N,) y agua. Encuen- 
tre una ecuación química balanceada para esta reacción. 


Solución Si el número de moléculas de amoniaco, oxígeno, nitrógeno y agua se deno- 
tan w, x, y y z, respectivamente, entonces se busca una ecuación de la forma 


wNH; + xO, —> yN, + zH,0 
Al comparar el número de átomos de nitrógeno, hidrógeno y oxígeno en los reactivos y 
productos, se obtienen tres ecuaciones lineales: 
Nitrógeno: w= 2y 
Hidrógeno: 3w = 2z 
Oxígeno: 2x=z 


Al reescribir estas ecuaciones en forma estándar se obtiene un sistema homogéneo de 
tres ecuaciones lineales con cuatro variables. [Note que el Teorema 2.3 garantiza que tal 
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sistema tendrá (un número infinito de) soluciones no triviales.] Reduzca la correspon- 
diente matriz aumentada mediante eliminación de Gauss-Jordan. 


w = 2y =0 1 0 -2  0|0 1 0 0 -¿lo0 
3w -2z = 0 —>|3 0 0 -—2l[0/|—|0 1 o -—3|0 
2x -z=0 0 2 0 -—1|0 o 0 1 —ilo 


Por tanto, w = $z, x = įz y y = 3z. El valor positivo más pequeño de z que producirá va- 

lores enteros para las cuatro variables es el mínimo común denominador de las fraccio- 
21 1 .z 

nes 3, 7 y 3, a saber, 6, lo que produce w = 4, x = 3, y = 2 y z = 6. Por tanto, la ecuación 


química balanceada es 


Muchas situaciones prácticas originan redes: redes de transporte, redes de comunicacio- 
nes y redes económicas, por nombrar algunas. De particular interés son los posibles flu- 
jos a través de las redes. Por ejemplo, los vehículos que fluyen a través de una red de ca- 
rreteras, la información que fluye a través de una red de datos, y los bienes y servicios que 
fluyen a través de una red económica. 
En este texto, una red consistirá de un número finito de nodos (también llamados 
fzo uniones o vértices) conectados mediante una serie de aristas dirigidas llamadas ramas o 
arcos. Cada rama se marcará con un flujo que representa la cantidad de algún objeto que 
puede fluir a lo largo o a través de cada rama en la dirección indicada. (Piense en los au- 
tomóviles que viajan a lo largo de una red de calles de un sentido.) La regla fandamen- 
tal que gobierna el flujo a través de una red es la conservación del flujo: 


4NH, + 30, —> 2N, + 6H,O 


p 


En cada nodo, el flujo de entrada es igual al flujo de salida. 


Figura 2.10 
Flujo en un nodo: f, + f, = 50 La figura 2.10 muestra una porción de una red, con dos ramas que entran a un nodo y 


dos que salen. La regla de conservación del flujo implica que el flujo entrante total, f, + fy 
unidades, debe coincidir con el flujo saliente total, 20 + 30 unidades. Por tanto, se tiene 
la ecuación lineal f, + f, = 50 que corresponde a este nodo. 

Puede analizar el flujo a través de toda una red al construir dichas ecuaciones y re- 
solver el sistema resultante de ecuaciones lineales. 


| 5 
Ejemplo 2.30 Describa los posibles flujos a través de la red de tuberías de agua que se muestra en la fi- 
gura 2.11, donde el flujo se mide en litros por minuto. 


Solución En cada nodo, escriba la ecuación que representa la conservación del flujo. 
Luego reescriba cada ecuación con las variables a la izquierda y la constante a la derecha, 
para obtener un sistema lineal en forma estándar. 


Node A: 15 =f +f f + f,= 15 
NodeB: f=f +10 ff = 10 
Node C: £+f>+5=30 L+f = 25 


Node D: f + 20=f fa — f= 20 
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| 
A d ry 
fl al 
20 f pon 
D C 
30) 


Figura 2.11 


Con eliminación de Gauss-Jordan, reduzca la matriz aumentada: 


1 0 0 1/15 1 0 0 1/15 

1-10 0110 0.1 0 la 
— 

0 1 1 0125 0 © 1 —1|20 

0 0 1 =1 |20 0 0 0 0| 0 


(Compruebe esto.) Se ve que existe una variable libre, f,, de modo que se tiene un nú- 
mero infinito de soluciones. Al hacer f, = t y expresar las variables pivote en términos de 
fp se obtiene 


f=15-t 
h= 5-=t 
f =20++t 
j= t 


Estas ecuaciones describen todos los flujos posibles y permiten analizar la red. Por ejem- 
plo, se ve que, si se controla el flujo en la rama AD de modo que t = 5 L/min, entonces 
los otros flujos son f, = 10,f, = 0, y f, = 25. 

Puede hacerlo todavía mejor. Puede encontrar los posibles flujos mínimo y máximo 
en cada rama. Cada uno de los flujos debe ser no negativo. Al examinar la primera y se- 
gunda ecuaciones a la vez, se ve que t < 15 (de otro modo f, sería negativo) y t < 5 (de 
otro modo f, sería negativo). La segunda de estas desigualdades es más restrictiva que la 
primera, de modo que debe usarla. La tercera ecuación no aporta más restricciones al 
parámetro t, así se deduce que 0 = t < 5. Al combinar este resultado con las cuatro ecua- 
ciones, se ve que 


10=<f<15 
0=<f=<5 

20<f,<25 
0=sf=<5 


Ahora se tiene una descripción completa de los posibles flujos a través de esta red. | 
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Las redes eléctricas son un tipo especializado de red que proporciona información 
acerca de fuentes de energía, como las baterías, y dispositivos impulsados por dichas 
fuentes, como las bombillas eléctricas o motores. Una fuente de energía “fuerza” a una 
corriente de electrones a fluir a través de la red, donde encuentran varios resistores, cada 
uno de los cuales requiere que se aplique cierta cantidad de fuerza para que la corriente 
fluya a través de él. 

La ley fundamental de la electricidad es la ley de Ohm, que establece exactamente 
cuánta fuerza E se necesita para impulsar una corriente I a través de un resistor con re- 
sistencia R: 


| 
Ley de Ohm 


fuerza = resistencia X corriente 


O ESRI 


e 


La fuerza se mide en volts, la resistencia en ohms y la corriente en amperes (o amps, para 
abreviar). Por tanto, en términos de dichas unidades, la ley de Ohm se convierte en “volts 
= ohms X amps”, y dice que es la “caída de voltaje” cuando una corriente pasa a través 
de un resistor; esto es: cuánto voltaje se usa. 

La corriente fluye desde la terminal positiva de una batería y viaja de vuelta hacia la 
terminal negativa, recorriendo uno o más circuitos cerrados en el proceso. En un dia- 
grama de red eléctrica, las baterías se representan como - H (donde la terminal positiva 


es la barra vertical más larga) y los resistores se representan como WWW. Las siguien- 
tes dos leyes, cuyo descubrimiento se debe a Kirchhoff, gobiernan las redes eléctricas. La 
primera es una ley de “conservación de flujo” en cada nodo; la segunda es una ley de “ba- 
lanceo de voltaje” alrededor de cada circuito. 


| 
Leyes de Kirchhoff 


Ley de corriente (nodos) 
La suma de las corrientes que fluyen hacia cualquier nodo es igual a la suma de las 
corrientes que salen de dicho nodo. 


Ley de voltaje (circuitos) 
La suma de las caídas de voltaje alrededor de cualquier circuito es igual al voltaje 
total alrededor del circuito (proporcionado por las baterías). 


La figura 2.12 ilustra las leyes de Kirchhoff. En el inciso (a), la ley de corriente pro- 
duce 1 = L + L (o1 — L — L = 0, como se le escribirá); el inciso (b) produce 4I = 10, 
donde se usó la ley de Ohm para calcular la caída de voltaje de 4I en el resistor. Al usar 
las leyes de Kirchhoff, puede establecer un sistema de ecuaciones lineales que permitirán 
determinar las corrientes en una red eléctrica. 


Ejemplo 2.31 


> 
Determine las corrientes J}, L, e I en la red eléctrica que se muestra en la figura 2.13. 


Solución Esta red tiene dos baterías y cuatro resistores. La corriente J} fluye a través de 
la rama superior BCA, la corriente 1, fluye a través de la rama media AB y la corriente I, 
fluye a través de la rama inferior BDA. 
En el nodo A, la ley de corriente produce I, + 1,=1, o 
L=-L+L=0 


(Observe que se obtiene la misma ecuación en el nodo B.) 


(a) l = h + e 
Figura 2.12 
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t— *— 
PEN Pea 8 volts 
| 2 ohms s 2 ohms 
I I 
10 volts 2 2 
A? ANN *B 
1 ohm 
4 ohms D 
I Pi 
NNN PA paa 
4 ohms — — 
(b) 41 = 10 16 volts 
Figura 2.13 


A continuación se aplica la ley de voltaje para cada circuito. Para el circuito CABC, 
las caídas de voltaje en los resistores son 21,, I, y 21,. Por tanto, se tiene la ecuación 


4 +L=8 
De igual modo, para el circuito DABD, se obtiene 
L +41 =16 


(Note que en realidad hay un tercer circuito, CADBC, si va “contra la corriente”. En este 
caso, debe tratar los voltajes y resistencias en las trayectorias “invertidas” como negativas. 
Al hacerlo se obtiene 21, + 21, — 4, = 8 — 16 = —8 04I, — 4I, = —8, que se observa 
es justo la diferencia de las ecuaciones de voltaje para los otros dos circuitos. En conse- 
cuencia, puede omitir esta ecuación, pues no aporta nueva información. Por otra parte, 
incluirla no hace daño.) 

Ahora se tiene un sistema de tres ecuaciones lineales con tres variables: 


L-L+ L= 0 


AL Ex = 8 
L+4L=16 
La eliminación de Gauss-Jordan produce 
1 —1 1| 0 1 0 Ofl 
4 1 0| 8| —> 10 1 0|4 
0 1 4|16 0 0 113 


Por tanto, las corrientes son 7, = 1 amp, I, = 4 amps e I, = 3 amps. 


Pe 


Comentario En algunas redes eléctricas, las corrientes pueden tener valores fraccio- 
narios o incluso pueden ser negativas. Un valor negativo simplemente significa que la 
corriente en la rama correspondiente fluye en la dirección opuesta a la que se muestra en 
el diagrama de la red. 


Ejemplo 2.32 


> 


La red que se muestra en la figura 2.14 tiene una sola fuente de poder A y cinco resisto- 
res. Encuentre las corrientes I, I, . . . , [,. Este es un ejemplo de lo que en ingeniería eléc- 
trica se conoce como circuito puente de Wheatstone. 
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2 ohms C 1 ohm 
ANN ANN 
11 2 ohms ja 
I 
La qi ls 
B ANN ANN D 
1 ohm E 2 ohms 
A 
<— | t— 
I 10 volts 1 
Figura 2.14 


Un circuito puente 


Solución La ley de corriente de Kirchhoff produce las siguientes ecuaciones en los cua- 
tro nodos: 
NodeB: I-I-L=0 
NodeC: L-=L-=LE=0 
NodeD: I=L-L=0 
NodeE: LE +I1,-1,=0 
Para los tres circuitos básicos, la ley de voltaje produce 
Circuit ABEDA: IL, + 21, = 10 
Circuit BCEB: 2h +2L-1L=0 
Circuit CDEC: L-2L-2L=0 
(Observe que la rama DAB no tiene resistor y por tanto no hay caída de voltaje; por ende, 
no hay término I en la ecuación para el circuito ABEDA. Note también que se cambiaron 
los signos tres veces, porque se avanzó “contra la corriente”. Esto no plantea problemas, 
pues se dejará que el signo de la respuesta determine la dirección del flujo de corriente.) 


Ahora se tiene un sistema de siete ecuaciones con seis variables. La reducción por 
renglones produce 


1 —1 0 0 -l 0j 0 1 0 0 0 0 OJ 7 
0 PoS 1 0 0| 0 01 0000-3 
1 0 =] 0 0 -1| 0 0 0 1 0 0 0| 4 
0 0 0 1 1 -1|0|—>|0 0 0 1 O 0O|-1 
0 0 0 0 1 2|10 0.0.0.0 1 0| 4 
0 2 0 2 =l 0j 0 0 0 0 0 0 1| 3 
0 0 1 =2 0 -—2| 0 0o 0 0 0 0 0| 0 


»> (Use su calculadora o CAS para comprobar esto.) Por tanto, la solución (en amps) es 
I=7,L =L=3,L=1!=+tel, 1. El significado del valor negativo aquí es que la 
corriente a través de la rama CE fluye en dirección opuesta a la que se marcó en el dia- 


grama. 


Comentario En este ejemplo sólo hay una fuente de poder, de modo que la única 


batería de 10 volts envía una corriente de 7 amps a través de la red. Si dichos valores se 


sustituyen en la ley de Ohm, E = RI, se obtiene 10 = 7R o R = ?. Por tanto, toda la red 
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a s a 10 
se comporta como si hubiese un solo resistor de 7 ohms. Este valor se conoce como re- 
sistencia efectiva (R) de la red. 


Una economía es un sistema muy complejo con muchas interrelaciones entre sus diver- 
sos sectores y los bienes y servicios que se producen y consumen. Determinar los precios 
óptimos y los niveles de producción sujetos a las metas económicas deseadas requiere so- 
fisticados modelos matemáticos. El álgebra lineal resulta ser una poderosa herramienta 
en el desarrollo y análisis de tales modelos económicos. 

En esta sección se introducen dos modelos basados en el trabajo del economista de 
Harvard, Wassily Leontief, en la décda de 1930. Sus métodos, a los que con frecuencia se 
les refiere como análisis input-output, ahora son herramientas estándar en la economía 
matemática y los usan ciudades, corporaciones y países completos para planificación y 
pronósticos económicos. 

Comience con un ejemplo simple. 


Ejemplo 2.33 


Wassily Leontief (1906-1999) nació 
en San Petersburgo, Rusia. Estudió 
en la Universidad de Leningrado y 
recibió su doctorado de la Universi- 
dad de Berlín. Emigró a Estados 
Unidos en 1931 e impartió clases en 
la Universidad de Harvard y más 
tarde en la Universidad de New 
York. En 1932, Leontief comenzó a 
recopilar datos para la monumental 
tarea de realizar un análisis input- 
output de la economía de Estados 
Unidos, cuyos resultados se publi- 
caron en 1941. Fue también uno de 
los primeros usuarios de compu- 
tadoras, que necesitaba para resolver 
los sistemas lineales de gran escala 
de sus modelos. Por su trabajo pio- 
nero, Leontief recibió el Premio 
Nobel de Economía en 1973. 


> 
La economía de una región consiste de tres industrias o sectores: servicios, electricidad y 
producción de petróleo. Por simplicidad, se supone que cada industria produce un solo 
artículo (bienes o servicios) en un año dado y que el ingreso (output) se genera a partir 
de la venta de este artículo. Cada industria compra artículos de las otras industrias, in- 
cluida ella misma, para generar su output. Ningún artículo se compra fuera de la región 
y ninguna salida (output) se vende fuera de la región. Más aún, para cada industria se su- 
pone que la producción iguala exactamente al consumo (output igual a input, ingreso 
igual a gasto). En este sentido, esta es una economía cerrada que está en equilibrio. La 
tabla 2.4 resume cuánta output de cada industria consume cada industria. 


Tabla 2.4 
Producido por (output) 
Servicios Electricidad Petróleo 

Servicios 1/4 1/3 1/2 
C id 
ATSU o por Flectricidad 1/4 1/3 1/4 
(input) 

Petróleo 1/2 1/3 1/4 


De la primera columna de la tabla se ve que la industria de servicios consume 1/4 de 
su propia output, la electricidad consume otro 1/4 y la industria petrolera usa 1/2 de la 
output de la industria de servicios. Las otras dos columnas tienen interpretaciones simi- 
lares. Note que la suma de cada columna es 1, lo que indica que se consumen todas las 
output de cada industria. 

Sean X,, X, y x, que denotan el output (ingreso) anual de las industrias de servicios, 
electricidad y petróleo, respectivamente, en millones de dólares. Dado que el consumo 
corresponde al gasto, la industria de servicios gasta 3 x, en su propio artículo, į x, en elec- 
tricidad y 3 x, en petróleo. Esto significa que el gasto total anual de la industria de servi- 
cios es] x, + 3 x,+ 3x3. Dado que la economía está en equilibrio, el gasto de la industria 
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de servicios debe ser igual a su ingreso anual x,. Esto genera la primera de las siguientes 
ecuaciones; las otras dos ecuaciones se obtienen al analizar los gastos de las industrias de 
electricidad y petróleo. 

Servicios:  3x+3x%+3%=X, 

Electricidad: 3x,+3x,+ 3%, = x% 

Petróleo: e 
Al reordenar cada ecuación, se obtiene un sistema homogéneo de ecuaciones lineales, 
que entonces se resuelven. (¡Compruebe esto!) 


3 1 1 PES 
4, +36 432% =0 


Die e= Aju 
| 

v= WIN ula 

| 

Al e= ni 

ooo 

D © 

O . oO 
| 

O buw = 

(am E e E e 


1 2 pr 
417 3%, 4% =0 
m 
2 


1 A 
Xx +3x3xX,=0 


Al hacer x, = t, se encuentra que x, = ty x, = į t. Por tanto, se ve que las outputs relati- 
vas de las industrias de servicios, electricidad y petrolera deben estar en las proporciones 


x,:x,:x,=4:3 : 4 para que la economía esté en equilibrio. | 
Comentarios 
+ El último ejemplo ilustra lo que comúnmente se conoce como modelo cerrado de 
Leontief. 


+ Dado que las output corresponden a ingreso, también puede considerar a X,, X3 
y x, como los precios de los tres artículos. 


Ahora se modifica el modelo del ejemplo 2.33 para acomodar una economía abierta, 
una en la que haya tanto demanda externa como interna por los artículos que se produ- 
cen. No es de sorprender que esta versión se conozca como modelo abierto de Leontief. 


Ejemplo 2.34 


> 


Considere las tres industrias del ejemplo 2.33, pero con consumo dado por la tabla 2.5. 
Se ve que, de los artículos producidos por la industria de servicios, 20% los consume la 
industria de servicios, 40% la industria eléctrica y 10% la industria petrolera. Por tanto, 
sólo 70% de la output de la industria de servicios lo consume esta economía. La impli- 
cación de este cálculo es que hay un exceso de output (ingreso) sobre el input (gasto) 
para la industria de servicios. Se dice que la industria de servicios es productiva. Del 
mismo modo, la industria petrolera es productiva, pero la industria eléctrica es no pro- 
ductiva. (Esto se refleja en el hecho de que las sumas de la primera y tercera columnas 
son menos que 1, pero la suma de la segunda columna es igual a 1.) El exceso de output 
puede aplicarse para satisfacer una demanda externa. 


Tabla 2.5 
Producido por (output) 
Servicios Electricidad Petróleo 
Servicios 0.20 0.50 0.10 
Consumido por . 
Electricidad 0.40 0.20 0.20 


(input) 
Petróleo 0.10 0.30 0.30 
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Por ejemplo, suponga que hay una demanda externa anual (en millones de dólares) 
de 10, 10 y 30 de las industrias de servicios, eléctrica y petrolera, respectivamente. En- 
tonces, al igualar los gastos (demanda interna y demanda externa) con el ingreso (out- 
put), se obtienen las siguientes ecuaciones: 


output demanda interna demanda externa 
Servicios Xx; = 0.2x, + 0.5x, + 0.1x, +10 
Eléctrica x, = 0.4x, + 0.2x, + 0.2x, +10 
Petrolera Xx, = 0.1x, + 0.3x, + 0.3x, + 30 


Al reordenar, se obtienen los siguientes sistemas lineal y matriz aumentada: 


0.8x, = 0.5x, = 0.1x, = 10 0.8 —0.5 —0.1| 10 
—0.4x, + 0.8x, — 0.2x, = 10 => 0.4 0.8 —0.2 | 10 
—0.1x, = 0.3x, + 0.7x, = 30 —0.1 —0.3 0.7 | 30 


cas Lareducción por renglón produce 


1 0 0 61.74 
0O 1 0 63.04 
0. 0 1 78.70 


de donde se ve que las industrias de servicios, eléctrica y petrolera deben tener una pro- 
ducción anual de $61.74, $63.04 y $78.70 (millones), respectivamente, para satisfacer las 
demandas interna y externa de sus artículos. 


En la sección 3.7 se volverá a revisar estos modelos. ea 


Juegos lineales finitos 


Existen muchas situaciones en las que se debe considerar un sistema físico que sólo tenga 
un número finito de estados. En ocasiones, dichos estados pueden alterarse con la apli- 
cación de ciertos procesos, cada uno de los cuales produce resultados finitos. Por ejem- 
plo, una bombilla puede estar encendida o apagada, y un interruptor puede cambiar el 
estado de la bombilla de encendido a apagado y viceversa. Los sistemas digitales que sur- 
gen en ciencias de la computación con frecuencia son de este tipo. De manera más frí- 
vola, muchos juegos de computadora presentan acertijos en los que cierto dispositivo 
debe ser manipulado por varios interruptores para producir un resultado deseado. La fi- 
nitud de tales situaciones es perfectamente adecuada para el análisis mediante aritmética 
modular, y con frecuencia los sistemas lineales sobre algún Z, desempeñan un papel. Los 
problemas que involucran este tipo de situación con frecuencia se llaman juegos lineales 
finitos. 


Ejemplo 2.39 | Una hilera de cinco luces se controla mediante cinco interruptores. Cada interruptor 
cambia el estado (encendido o apagado) de la luz directamente arriba de él y los estados 
de las luces inmediatamente adyacentes a izquierda y derecha. Por ejemplo, si la primera 
y tercera luces están encendidas, como en la figura 2.15(a), entonces oprimir el inte- 
rruptor A cambia el estado del sistema al que se muestra en la figura 2.15(b). Si a conti- 
nuación se oprime el interruptor C, entonces el resultado es el estado que se muestra en 
la figura 2.15(c). 
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Figura 2.15 


[Ey Y MA AY 


A If If Vs UL If Ií 3 Be uS 
A B C D E A B C D E 


(b) (c) 


Suponga que, inicialmente, todas las luces están apagadas. ¿Puede oprimir los inte- 
rruptores en algún orden de modo que sólo la primera, tercera y quinta luces estén en- 
cendidas? ¿Puede oprimir los interruptores en algún orden de modo que sólo la primera 
luz esté encendida? 


Solución La naturaleza encendido/apagado de este problema sugiere que la notación 
binaria será útil y que debe trabajar con Z,. En concordancia, los estados de las cinco 
luces se representan mediante un vector en Z3 , donde 0 representa apagado y 1 repre- 
senta encendido. Por tanto, por ejemplo, el vector 


0 


O O m. =. 


corresponde a la figura 2.15(b). 

También puede usar vectores en Z3 para representar la acción de cada interruptor. Si 
un interruptor cambia el estado de una luz, el componente correspondiente es un 1; de 
otro modo, es 0. Con esta convención, las acciones de los cinco interruptores están dados 
por 


Pp 
| 
O O O m m 
To 
II 
OO (RR 
Rh hh RL. O O 
© 
Il 
== =. O O O 


mn 
| 
oO o. om 


seguido por 


p 
| 
ooon 
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Es la suma vectorial (en Z3) 


s+a= 


oOo o.e oo 


Observe que este resultado concuerda con la figura 2.15(b). 

A partir de cualquier configuración inicial s, suponga que se oprimen los interrup- 
tores en el orden A, C, D, A, C, B. Esto corresponde a la suma vectorial s + a + c + d + 
a + c + b. Pero, en Z}, la suma es conmutativa, de modo que se tiene 


s+ta+c+d+a+tctb=s+2a+b+2c+d 
=s+bw+d 

donde se usó el hecho de que 2 = 0 en Z,. Por ende, se lograría el mismo resultado al 
oprimir sólo B y D, y el orden no importa. (Compruebe que esto es correcto.) Por tanto, 
en este ejemplo no es necesario oprimir algún interruptor más de una vez. 

De este modo, para ver si es posible lograr una configuración objetivo t a partir de 
una configuración inicial s, es necesario determinar si existen escalares x, . . . , X; en Z, 
tales que 


s+xa+xb+:c:+xe=t 


En otras palabras, es necesario resolver (si es posible) el sistema lineal sobre Z, que co- 
rresponde a la ecuación vectorial 


xa+xob+o o +xe=t=s=t>w+s 


En este caso, s = 0 y la primera configuración objetivo es 


Gaa 
II 
= oOo =. OD e.e 


La matriz aumentada de este sistema tiene como columnas los vectores dados: 


1 1 0 O 0|1 
1 1 1 0O 0/0 
O 1 1 1 0/1 
0.00 1 1 1/0 
0 0 O 1 1/1 
Al reducir sobre Z, se obtiene 
1 0 0 O 1/0 
0O 1 0O O 1/1 
0 0-1 0-0j|l 
0 0 O 1 1|1 
0 0 0 0 0/0 
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Por tanto, x; es una variable libre. En consecuencia, existen exactamente dos soluciones 
(que corresponden a x; = 0 y x; = 1). Al despejar las otras variables en términos de x;, se 
obtiene 

Xx] = Xs 

xX% = l+% 

%; = 1 


x, = l+% 


De modo que, cuando x; = 0 y x; = 1, se tienen las soluciones 


X 0 X 1 
X 1 Xz 0 
x|=|1 y Xx3|=|1 
Xa 1 Xa 0 
Xs 0 X5 1 


»—> respectivamente. (Compruebe que estas dos funcionan.) 


De igual modo, en el segundo caso se tiene 


et 
II 
0o ooon 


1 1 0 0 0l1 1 0 0 O0 1/0 
1 1 1 0 0l0 0O 1 0 O0 1jl 
0 1 1 1 00| >|0 0 1 O Ofl 
0 0 1 1 110 0 0 0O 1 1jl 
0 0 0 1 110 0 0 0 0 0]|1 


lo que muestra que no hay solución en este caso; esto es: es imposible comenzar con 
todas las luces apagadas y sólo encender la primera luz. 


El ejemplo 2.35 muestra el poder del álgebra lineal. Aun cuando haya encontrado 
mediante ensayo y error que no había solución, comprobar todas las formas posibles de 
oprimir los interruptores habría sido extremadamente tedioso. También podría haberse 
pasado por alto el hecho de que ningún interruptor necesita oprimirse más de una vez. 


| > 

Ejemplo 2.36 Considere una hilera sólo con tres luces, cada una de las cuales puede estar apagado, ser 
azul claro o azul oscuro. Abajo de las luces hay tres interruptores, A, B y C, cada uno de 

los cuales cambia los estados de luces particulares al siguiente estado, en el orden que 

muestra la figura 2.16. El interruptor A cambia los estados de las primeras dos luces, el 

interruptor B las tres luces y el interruptor C las últimas dos luces. Si las tres luces ini- 

cialmente están apagadas, ¿es posible oprimir los interruptores en cierto orden de modo 


Apagado 


Azul oscuro Azul claro 


A 


Figura 2.16 


p— 


Ejercicios 2.4 
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Ey Y 


Ea E. E A 

ws 14 ws i wi iE, nl 

A B G A B Cc 
Figura 2.17 


que las luces estén apagadas, azul claro y azul oscuro, en ese orden (como en la figura 
2.17)? 


Solución Mientras que el ejemplo 2.35 involucraba Z,, este claramente (¿es claro?) in- 
volucra Z,. En concordancia, los interruptores corresponden a los vectores 


1 1 0 
a=|1|b=|1|,c=]|1 
0 1 1 
0 
en Z3, y la configuración final que se busca es t = | 1 |. (Apagado es 0, azul claro es 1 y 
2 


azul oscuro es 2.) Se quiere encontrar escalares x,, x,, x; en Z tales que 
xa + xb + x30=t 


(donde x; representa el número de veces que se oprime el i-ésimo interruptor). Esta 
ecuación da lugar a la matriz aumentada [a b c | t], que se reduce sobre Z, del modo si- 
guiente: 


00 1 0 02 
11| ~> Jo 1 oji 
1|2 0 0 111 


O =. m 
j= 


1 


Por tanto, existe una solución única: x, = 2, x, = 1, x, = 1. En otras palabras, debe opri- 
mir el interruptor A dos veces y los otros dos interruptores una vez cada uno. (Com- 


pruébelo.) 


> 


Y 


1. Suponga que, en el ejemplo 2.27, en el tubo de ensayo se 


colocan cada día 400 unidades de alimento A, 600 uni- 
dades de B y 600 unidades de C, y que los datos del con- 
sumo diario de alimento por bacteria (en unidades por 
día) son los que se muestran en la tabla 2.6. ¿Cuántas 
bacterias de cada cepa pueden coexistir en el tubo de 
ensayo y consumir todo el alimento? 

. Suponga que, en el ejemplo 2.27, en el tubo de ensayo se 
colocan cada día 400 unidades de alimento A, 500 uni- 
dades de B y 600 unidades de C, y que los datos del con- 


Tabla 2.6 
Bacteria Bacteria Bacteria 
cepa I cepa II cepa III 
Alimento A 1 2 0 
Alimento B 2 1 1 
Alimento C 1 1 2 


sumo diario de alimento por bacteria (en unidades por 
día) son los que se muestran en la tabla 2.7. ¿Cuántas 
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Tabla 2.7 
Bacteria Bacteria Bacteria 
cepa I cepa II cepa III 
Alimento A 1 2 0 
Alimento B 2 1 3 
Alimento C 1 1 1 


bacterias de cada cepa pueden coexistir en el tubo de 
ensayo y consumir todo el alimento? 


3. Una florista ofrece tres tamaños de arreglos florales que 
contienen rosas, margaritas y crisantemos. Cada arreglo 
pequeño contiene una rosa, tres margaritas y tres cri- 
santemos. Cada arreglo mediano contiene dos rosas, 
cuatro margaritas y seis crisantemos. Cada arreglo 
grande contiene cuatro rosas, ocho margaritas y seis cri- 
santemos. Un día, la florista nota que usó un total de 24 
rosas, 50 margaritas y 48 crisantemos para surtir pedi- 
dos de estos tres tipos de arreglos. ¿Cuántos arreglos de 
cada tipo elaboró? 


4. (a) En su bolsillo usted tiene algunas monedas de cinco, 
diez y 25 centavos. En total tiene 20 monedas y 
exactamente el doble de monedas de diez centavos 
que de cinco. El valor total de las monedas es $3.00. 
Encuentre el número de monedas de cada tipo. 

(b) Encuentre todas las posibles combinaciones de 20 
monedas (de cinco, diez y 25 centavos) que suma- 
rían exactamente $3.00. 


5. Un cafetalero vende tres mezclas de café. Una bolsa de la 
mezcla de la casa contiene 300 gramos de grano colom- 
biano y 200 gramos de grano rostizado francés. Una 
bolsa de la mezcla especial contiene 200 gramos de 
grano colombiano, 200 gramos de grano keniano y 100 
gramos de grano rostizado francés. Una bolsa de mezcla 
gourmet contiene 100 gramos de grano colombiano, 
200 gramos de grano keniano y 200 gramos de grano 
rostizado francés. El comerciante tiene a la mano 30 ki- 
logramos de grano colombiano, 15 kilogramos de grano 
keniano y 25 kilogramos de grano rostizado francés. Si 
quiere usar todos los granos, ¿cuántas bolsas de cada 
tipo de mezcla puede elaborar? 


6. Vuelva a hacer el ejercicio 5 y suponga que la mezcla de 
la casa contiene 300 gramos de grano colombiano, 50 
gramos de grano keniano y 150 gramos de grano rosti- 
zado francés, y que la mezcla gourmet contiene 100 gra- 
mos de grano colombiano, 350 gramos de grano ke- 
niano y 50 gramos de grano rostizado francés. Esta vez 
el comerciante tiene 30 kilogramos de grano colom- 
biano, 15 kilogramos de grano keniano y 15 kilogramos 
de grano rostizado francés. Suponga que una bolsa de la 


mezcla de la casa produce una ganancia de $0.50, una 
bolsa de la mezcla especial produce una ganancia de 
$1.50 y una bolsa de la mezcla gourmet produce una ga- 
nancia de $2.00. ¿Cuántas bolsas de cada tipo debe pre- 
parar el comerciante si quiere usar todos los granos y 
maximizar su ganancia? ¿Cuál es la ganancia máxima? 


En los ejercicios 7-14, balancee la ecuación química para cada 
reacción. 


7. FeS, + O, > Fe,O, + SO, 


8. CO, + H,O ——> C¿H,,0, + O, (Esta reacción tiene 
lugar cuando una planta verde convierte dióxido de car- 
bono y agua en glucosa y oxígeno durante la fotosínte- 
sis.) 

9. C,H io + O, > CO, + H,O (Esta reacción ocurre 
cuando butano, C,H; se quema en presencia de oxí- 
geno para formar dióxido de carbono y agua.) 


. C¿H¿O, + O, > HO + CO, 
. C-H OH + O, —> H,O + CO, (Esta ecuación repre- 
senta la combustión de alcohol amílico.) 


. HCIO, + P,O, —>H,PO, + CLO, 
13. Na,CO, + C + N, —> NaCN + CO 
s 14, C,H,CL, + Ca(OH), —> C,HCl, + CaCl, + H,O 


15. La figura 2.18 muestra una red de tuberías con flujos 

medidos en litros por minuto. 

(a) Establezca y resuelva un sistema de ecuaciones 
lineales para encontrar los flujos posibles. 

(b) Si el flujo a través de AB se restringe a 5 L/min, 
¿cuáles serán los flujos a través de las otras ramas? 

(c) ¿Cuáles son los posibles flujos mínimo y máximo a 
través de cada rama? 

(d) Se supuso que el flujo siempre es positivo. ¿Qué sig- 
nificaría flujo negativo, si supone que se permite? 
Proporcione una ilustración para este ejemplo. 


ze A 4, 
30 
A| - 
C 
10, L, 


B 
Figura 2.18 


16. La parte central de Ciudad Gótica consiste de calles de 
un sentido, y el flujo de tráfico se midió en cada inter- 
sección. Para el bloque de ciudad que se muestra en la 
figura 2.19, los números representan la cantidad prome- 
dio de vehículos por minuto que entran y salen de las 
intersecciones A, B, C y D durante, las horas de oficina. 
(a) Establezca y resuelva un sistema de ecuaciones 
lineales para encontrar los flujos posibles f,..., f,. 

(b) Si el tráfico se regula en CD de modo que f, = 10 
vehículos por minuto, ¿cuáles son los flujos prome- 
dio en las otras calles? 

(c) ¿Cuáles son los posibles flujos mínimo y máximo en 
cada calle? 

(d) ¿Cómo cambiaría la solución si todas las direcciones 
se invirtieran? 


10] 20] 
10 fi EN 
Al B? 
h| Al 
15 PELS 15 
D? c? 
10] ist 
Figura 2.19 


17. Una red de diques de irrigación se muestra en la figura 
2.20, con flujos medidos en miles de litros por día. 


Figura 2.20 
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(a) Establezca y resuelva un sistema de ecuaciones 
lineales para encontrar los posibles flujos f, . . . , f. 

(b) Suponga que DC está cerrado. ¿Qué intervalo de 
flujo se necesitará mantener a través de DB? 

(c) De la figura 2.20 es claro que DB no puede cerrarse. 
(¿Por qué no?) ¿Cómo su solución al inciso (a) de- 
muestra esto? 

(d) De su solución al inciso (a), determine los flujos mí- 
nimo y máximo a través de DB. 


18. (a) Establezca y resuelva un sistema de ecuaciones 
lineales para encontrar los posibles flujos en la red 
que se muestra en la figura 2.21. 

(b) ¿Es posible que f, = 100 y fg = 150? (Primero res- 
ponda esta pregunta con referencia a su solución 
del inciso (a), y luego directamente de la figura 
2.21.) 

(c) Si f, = 0, ¿cuál será el rango de flujo en cada una de 
las otras ramas? 


100] 150 | 200) 
200, fi da 100, 
A B Ç 
Ai fa | Ai 
«20 Jo h ¿150 
D E F 
100) 100 | 100) 
Figura 2.21 


Para los ejercicios 19 y 20, determine las corrientes para las 
redes eléctricas dadas. 


19. l C l 
«— 4— 
8 volts 
z 1 ohm 
h h 
— —> 
A? NNW *B 
1 ohm 
4 ohms s 
h D h 
| 
13 volts 
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20. l C l 
4— | — 
5 volts 
1 ohm 
h h 
— — 
At ANN *B 
2 ohms 
4 ohms z 
I D L 
| 
8 volts 


21. (a) Encuentre las corrientes LI, .. 
puente de la figura 2.22. 
(b) Encuentre la resistencia efectiva de esta red. 
(c) ¿Puede cambiar la resistencia en la rama BC (y dejar 
todo lo demás invariable) de modo que la corriente 
a través de la rama CE se vuelva 0? 


. , I; en el circuito 


Figura 2.22 


22. Las redes de los incisos (a) y (b) de la figura 2.23 mues- 
tran dos resistores acoplados en serie y en paralelo, res- 
pectivamente. Se quiere encontrar una fórmula general 
para la resistencia efectiva de cada red; esto es, encontrar 
R, de manera que E = Rol. 

(a) Demuestre que la resistencia efectiva R, de una red 
con dos resistores acoplados en serie [figura 2.23(a)] 
está dada por 


Ra =R¡+R, 
(b) Demuestre que la resistencia efectiva R,¿de una red 


con dos resistores acoplados en paralelo [figura 
2.23(b)] está dada por 


R il 
a= 1 
E + === 
R R 
Rı R 
NW ANN 
$ 
H 
E 
(a) 
l R; 
NN 
h R3 
$ 
|i 
E 
(b) 
Figura 2.23 


Resistores en serie y en paralelo 


23. Considere una economía simple con sólo dos industrias: 
agrícola y manufacturera. La agrícola consume 1/2 de 
los alimentos y 1/3 de los bienes manufacturados. La 
manufacturera consume 1/2 de los alimentos y 2/3 de 
los bienes manufacturados. Si supone que la economía 
está cerrada y en equilibrio, encuentre las salidas relati- 
vas (outputs) de las industrias agrícola y manufacturera. 


24. Suponga que las industrias del carbón y el acero forman 
una economía cerrada. Cada $1 producido por la indus- 
tria del carbón requiere $0.30 de carbón y $0.70 de 
acero. Cada $1 producido por la del acero requiere $0.80 
de carbón y $0.20 de acero. Encuentre la producción 
anual (output) de carbón y acero si la producción anual 
total es de $20 millones. 


25. Un pintor, un plomero y un electricista entran a una co- 
operativa en la que cada uno de ellos está de acuerdo en 
trabajar para sí mismo y los otros dos por un total de 10 
horas a la semana, de acuerdo con el horario que se 
muestra en la tabla 2.8. Para propósitos fiscales, cada 
persona debe establecer un valor para sus servicios. 
Están de acuerdo en hacerlo, de modo que cada uno de 
ellos quede a la par, es decir: de modo que el importe 


total pagado por cada persona sea igual al importe que 
recibe. ¿Qué tarifa horaria debe cobrar cada persona si 
todas las tarifas son números enteros entre $30 y $60 
por hora? 


Tabla 2.8 
Proveedor 
Pintor Plomero Electricista 
Pintor 2 1 5 
Consumidor Plomero 4 5 1 
Electricista 4 4 4 


26. Cuatro vecinos, cada uno con un jardín de vegetales, 


27. 


28. 


está de acuerdo en compartir sus productos. Uno cose- 
chará frijoles (B), otro lechuga (L), otro tomates (T) y 
otro calabazas (Z). La tabla 2.9 muestra qué fracción de 
cada cultivo recibirá cada vecino. ¿Qué precios deben 
cobrar los vecinos por sus cultivos, si cada persona debe 
quedar a la par y el cultivo de menor precio tiene un 
valor de $50? 


Tabla 2.9 
Productor 
B L T Z 
B 0 1/4 1/8 1/6 
Cosumidor L 1/2 1/4 1/4 1/6 
T 1/4 1/4 1/2 1/3 
Z 1/4 1/4 1/8 1/3 


Suponga que las industrias del carbón y del acero for- 
man una economía abierta. Cada $1 producido por la 
industria del carbón requiere $0.15 de carbón y $0.20 de 
acero. Cada $1 producido por la del acero requiere $0.25 
de carbón y $0.10 de acero. Suponga que hay una de- 
manda exterior anual por $45 millones de carbón y 
$124 millones de acero. 

(a) ¿Cuánto debe producir cada industria para satisfa- 
cer las demandas? 

(b) Si la demanda de carbón disminuye en $5 millones 
al año, mientras que la demanda de acero aumenta 
en $6 millones al año, ¿cómo deben ajustar su pro- 
ducción las industrias del carbón y del acero? 


En Ciudad Gótica, los departamentos de Administra- 
ción (A), Salud (H) y Transporte (T) son independien- 
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tes. Para cada dólar de servicios que producen, cada de- 
partamento usa cierta cantidad de servicios producidos 
por los otros departamentos y por él mismo, como se 
muestra en la tabla 2.10. Suponga que, durante el año, 
otros departamentos de la ciudad requieren $1 millón 
en servicios administrativos, $1.2 millones en servicios 
de salud y $0.8 millones en servicios de transporte. 
¿Cuál debe ser el valor anual en dólares de los servicios 
producidos por cada departamento, con la finalidad de 
satisfacer las demandas? 


Tabla 2.10 
Departmento 
A H T 
A $0.20 0.10 0.20 
Compra H 0.10 0.10 0.20 
T 0.20 0.40 0.30 


29. (a) En el ejemplo 2.35, suponga que todas las luces ini- 
cialmente están apagadas. ¿Puede oprimir los inte- 
rruptores en algún orden para que sólo enciendan la 
segunda y cuarta luces? 

(b) ¿Puede oprimir los interruptores en algún orden de 
modo que sólo se encienda la segunda luz? 


30. (a) En el ejemplo 2.35, suponga que la cuarta luz ini- 
cialmente está encendida y que las otras cuatro luces 
están apagadas. ¿Puede oprimir los interruptores en 
algún orden de modo que sólo enciendan la se- 
gunda y cuarta luces? 

(b) Puede oprimir las interruptores en algún orden de 
modo que sólo se encienda la segunda luz? 


31. En el ejemplo 2.35, describa todas las posibles configu- 
raciones de luces que pueden obtenerse si comienza con 
todas las luces apagadas. 


32. (a) En el ejemplo 2.36, suponga que todas las luces ini- 
cialmente están apagadas. Demuestre que es posible 
presionar los interruptores en cierto orden de modo 
que las luces están apagadas, azul oscuro y azul 
claro, en ese orden. 

(b) Demuestre que es posible oprimir los interruptores 
en cierto orden de modo que las luces estén azul 
claro, apagadas y azul oscuro, en ese orden. 

(c) Pruebe que puede lograrse cualquier configuración 
de tres luces. 


33. Suponga que las luces del ejemplo 2.35 pueden estar 
apagadas, azul claro o azul oscuro, y que los interrupto- 
res funcionan como se describe en el ejemplo 2.36. (Esto 
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es: los interruptores controlan las mismas luces que en 
el ejemplo 2.35, pero los colores avanzan en ciclo como 
en el ejemplo 2.36.) Demuestre que es posible comenzar 
con todas las luces apagadas y oprimir los interruptores 
en cierto orden de modo que las luces sean azul oscuro, 
azul claro, azul oscuro, azul claro y azul oscuro, en ese 
orden. 

34. Para el ejercicio 33, describa todas las posibles configu- 
raciones de luces que pueden obtenerse, iniciando con 
todas las luces apagadas. 


cas 35, Nueve cuadrados, cada uno negro o blanco, se ordenan 


en una retícula de 3 X 3. La figura 2.24 muestra un po- 
sible arreglo. 


Figura 2.24 
El acertijo de nueve 
cuadrados 


Cuando se toca, cada cuadrado cambia su estado y los 
estados de alguno de sus vecinos (negro — blanco y 
blanco —> negro). La figura 2.25 muestra cómo funciona 


Figura 2.25 


Cambios de estado para el acertijo de nueve cuadrados 


el cambio de estado. (Tocar el cuadrado cuyo número 

está en un círculo, hace que cambie el estado del cuadro 

marcado *.) El objeto del juego es volver negros los 
nueve cuadrados. [Los ejercicios 35 y 36 se adaptaron de 
acertijos que pueden encontrarse en el CD-ROM de 
juego interactivo The Seventh Guest (Trilobyte Soft- 

ware/Virgin Games, 1992).] 

(a) Si la configuración inicial es la que se muestra en la 
figura 2.24, demuestre que puede ganar el juego y 
describa una secuencia de movimientos ganadora. 

(b) Pruebe que el juego siempre puede ganarse, sin im- 
portar cuál sea la configuración inicial. 


cas 36. Considere una variación del acertijo de nueve cuadra- 


dos. El juego es el mismo que se describe en el ejercicio 
35, excepto que hay tres posibles estados para cada cua- 
drado: blanco, gris o negro. Los cuadrados cambian 
como se muestra en la figura 2.25, pero ahora el estado 
cambia siguiendo el ciclo blanco —> gris > negro > 
blanco. Demuestre cómo puede lograrse la combinación 
ganadora todos negros a partir de la configuración ini- 
cial que se muestra en la figura 2.26. 


Figura 2.26 
Acertijo de nueve 
cuadrados con más 
estados 


En los ejercicios 37-53, establezca y resuelva un sistema ade- 
cuado de ecuaciones lineales para responder las preguntas. 


37. Grace es tres veces mayor que Hans, pero en 5 años ten- 
drá el doble de la edad que Hans tiene ahora. ¿Qué eda- 
des tienen ahora? 


38. La suma de las edades de Annie, Bert y Chris es 60. 
Annie es mayor que Bert por el mismo número de años 
que Bert es mayor que Chris. Cuando Bert sea tan viejo 
como ahora es Annie, Annie será tres veces más vieja de 
lo que Chris es ahora. ¿Cuáles son sus edades? 


Los dos problemas anteriores son típicos de los que se encuen- 
tran en libros populares de acertijos matemáticos. Sin em- 
bargo, tienen sus orígenes en la antigüedad. Una tablilla de 
arcilla de Babilonia, que sobrevive desde aproximadamente 
300 a.C., contiene el siguiente problema. 


39. Existen dos campos cuya área total es 1800 yardas cua- 
dradas. Un campo produce grano a razón de 2/3 de fa- 
nega por yarda cuadrada; el otro campo produce grano 
a razón de $ fanega por yarda cuadrada. Si la produc- 
ción total es de 1100 fanegas, ¿cuál es el tamaño de cada 
campo? 


Hace más de 2000 años, los chinos desarrollaron métodos para 
resolver sistemas de ecuaciones lineales, incluida una versión 
de la eliminación gaussiana que no fue muy conocida en Eu- 
ropa sino hasta el siglo XIX. (No hay evidencia de que Gauss 
estuviese al tanto de los métodos chinos cuando desarrolló lo 
que ahora se conoce como eliminación gaussiana. Sin em- 
bargo, es claro que los chinos conocían la esencia del método, 
aun cuando no justificaron su uso.) El siguiente problema se 
toma del texto chino Jiuzhang suanshu (Nueve capítulos en 
el arte matemático), escrito durante la temprana dinastía 
Han, alrededor de 200 a.C. 


40. Existen tres tipos de maíz. Tres gavillas del primer tipo, 
dos del segundo y una del tercero constituyen 39 medi- 
das. Dos gavillas del primer tipo, tres del segundo y una 
del tercero constituyen 34 medidas. Y una gavilla del 
primer tipo, dos del segundo y tres del tercero constitu- 
yen 26 medidas. ¿Cuántas medidas de maíz contiene 
una gavilla de cada tipo? 


41. Describa todos los posibles valores de a, b, c y d que 
harán que cada una de las siguientes sea una tabla de 
sumas válida. [Los problemas 41-44 se basan en el 
artículo “An Application of Matrix Theory” de Paul 
Glaister en The Mathematics Teacher, 85 (1992), pp. 220- 
223.] 

(a) +ļa b (b) +|a b 

c ¡2 3 c|3 6 

d14 5 d|4 5 

42. ¿Qué condiciones de w, x, y y z garantizarán que puedan 
encontrarse a, b, c y d de modo que la siguiente sea una 
tabla de sumas válida? 


N RIS 


+la 
E w 
d| y 


43. Describa todos los posibles valores de a, b, c, d, e y f que 
harán de cada una de las siguientes una tabla de sumas 
válida. 


(a) (b) 


SN 
Do e NIS 


+ 
d 
e 
f 


> U wa 
= ù% mla 
A w eja 
0 Ae NIS 
Aoun wis 


AS 49, 


cas 50. 
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44. Al generalizar el ejercicio 42, encuentre las condiciones 
para las entradas de una tabla de sumas 3 X 3 que ga- 
rantizarán que pueda resolverse para a, b, c, d, e y f como 
antes. 


45. De la geometría elemental se sabe que hay una sola línea 
recta que pasa a través de dos puntos cualesquiera en un 
plano. Menos conocido es el hecho de que existe una 
parábola única a través de cualesquiera tres puntos no 
colineales en un plano. Para cada de los siguientes con- 
juntos de puntos, encuentre una parábola con una ecua- 
ción de la forma y = ax? + bx + c que pase a través de 
los puntos dados. (Grafique la parábola resultante para 
comprobar la validez de su respuesta.) 


(a) (0,1),(21,4) y (2,1) 
(b) (3, 1), (72,2) y (— 1, 5) 


46. A través de cualesquiera tres puntos no colineales tam- 
bién pasa una circunferencia única. Encuentre las cir- 
cunferencias (cuyas ecuaciones generales sean de la 
forma xX + y? + ax + by + c = 0) que pasan a través de 
los conjuntos de puntos del ejercicio 45. (Para compro- 
bar la validez de su respuesta, encuentre el centro y el 
radio de cada circunferencia y dibuje una gráfica.) 


El proceso de sumar funciones racionales (razones de polino- 
mios) al colocarlos sobre un denominador común es el análogo 
de sumar números racionales. El proceso inverso, de descom- 
poner una función racional al escribirla como una suma de 
funciones racionales más simples, es útil en muchas áreas de 
las matemáticas; por ejemplo, surge en cálculo cuando se debe 
integrar una función racional y en matemáticas discretas 
cuando se usan funciones generadoras para resolver relaciones 
de recurrencia. La descomposición de una función racional 
como una suma de fracciones parciales conduce a un sistema 
de ecuaciones lineales. En los ejercicios 47-50, encuentre la 
descomposición en fracciones parciales de la forma dada. (Las 
letras mayúsculas denotan constantes.) 


3x +1 A B 
47.5 = 
Xot 2x =3 x=] x+t3 
xX- 3x+3 A B E 
48. 


X +2 +x x x+l (x+1) 
P a 


(x + 1)(x? + 1)(x? + 4) 


A BFC DXFE 


x+1 +i y Fä 
Adal A, B 
x(x — 1)(x? +x + 1)\(x? +1} x x-1 
Cx+ D Ex + F Gx + H Ix+] 
Pr al kir e 
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A continuación hay dos fórmulas útiles para las sumas de po- 
tencias de números naturales consecutivos: 


n(n + 1) 
2 


1+2+ 0 +n= 


y 
n(n + 1)Qn + 1) 


6 


P2 +e e 


La validez de estas fórmulas para todos los valores de n = 1 (o 
incluso n = 0) puede establecerse usando inducción matemá- 
tica (vea el Apéndice B). Sin embargo, una forma de hacer 
una suposición educada acerca de cuáles son las fórmulas, es 
observar que puede reescribir las dos fórmulas anteriores como 


idal 1,311,271 
3N + zn y zn T 3N F gn 
respectivamente. Esto conduce a la conjetura de que la suma 


de las p-ésimas potencias de los primeros números naturales es 
un polinomio de grado p + 1 en la variable n. 


51. Si supone que 1 +2 +: + n = an? + bn + c, en- 
cuentre a, b y c al sustituir tres valores para n y por tanto 
obtener un sistema de ecuaciones lineales con a, b y c. 

52. Suponga que 17 + 2? + = + n? = an? + bn? +cn+d. 
Encuentre a, b, c y d. [Sugerencia: es legítimo usar n = 0. 
¿Cuál es el lado izquierdo en este caso?] 


53. Demuestre que 1° + 2? +- + w? = (n(n + 1)/2). 


Esta aplicación se basa en el 
artículo “An Underdetermined Li- 
near System for GPS” por Dan 
Kalman en The College Mathema- 
tics Journal, 33 (2002), pp. 384- 
290. Para un tratamiento más 
profundo de las ideas aquí presen- 
tadas, vea G. Strang y K. Borre, Li- 
near Algebra, Geodesy, and GPS 
(Wellesley-Cambridge Press, MA, 
1997). 


7 
| j | | ( 


El sistema de posicionamiento global (GPS, por sus siglas en inglés) se usa en muchas si- 
tuaciones para determinar ubicaciones geográficas. Militares, topógrafos, líneas aéreas, 
compañías de transporte y excursionistas lo usan. La tecnología GPS se ha convertido en 
lugar común, a tal grado que algunos automóviles, teléfonos celulares y varios dispositi- 
vos manuales ahora están equipados con él. 

La idea básica del GPS es una variante de la triangulación tridimensional: un punto 
sobre la superficie de la Tierra está determinado de manera exclusiva al conocer su dis- 
tancia desde otros tres puntos. Aquí el punto que se quiere determinar es la ubicación del 
receptor GPS, los otros puntos son satélites y las distancias se calculan mediante los 
tiempos de recorrido de señales de radio enviadas de los satélites al receptor. 

Se supondrá que la Tierra es una esfera sobre la cual se superpone un sistema de co- 
ordenadas xyz, con el centro de la Tierra en el origen y con el eje z positivo que corre a lo 
largo del polo norte y está fijo en relación con la Tierra. 

Por simplicidad, considere que una unidad es igual al radio de la Tierra. Por tanto, la 
superficie de la Tierra se convierte en la esfera unitaria con ecuación x? + y? + 2 = 1. 
El tiempo se medirá en centésimas de segundo. El GPS encuentra las distancias al cono- 
cer cuánto tarda una señal de radio en ir desde un punto a otro. Para esto es necesario 
conocer la rapidez de la luz, que es aproximadamente igual a 0.47 (radios terrestres por 
centésimas de segundo). 

Imagine que usted es un excursionista perdido en el bosque en el punto (x, y, z) en 
cierto momento t. No sabe dónde está y, más aún, no tiene reloj, así que no sabe qué hora 
es. Sin embargo, tiene su dispositivo GPS y recibe señales simultáneas de cuatro satélites, 
que le dan sus posiciones y tiempos como se muestra en la tabla 2.11. (Las distancias se 
miden en radios terrestres y el tiempo en centésimas de segundo después de mediano- 
che.) 


Tabla 2.11 Datos satelitales 


Satélite Posición Tiempo 
1 (1.11, 2.55, 2.14) 1.29 
2 (2.87, 0.00, 1.43) 1.31 
3 (0.00, 1.08, 2.29) 2.75 
4 (1.54, 1.01, 1.23) 4.06 
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Sea (x, y, z) su posición, y sea t el tiempo cuando llegan las señales. La meta es resol- 
ver para x, y, z y t. Su distancia al satélite 1 puede calcularse del modo siguiente. La señal, 
que viaja a una rapidez de 0.47 radios terrestres/10”? s, se envió en el tiempo 1.29 y llegó 
en el tiempo t, de modo que tardó t — 1.29 centésimas de segundo en llegar a usted. La 
distancia es igual a la velocidad multiplicada por el tiempo (transcurrido), de modo que 


d = 0.47(t— 1.29) 


También puede expresar d en términos de (x, y, z) y la posición del satélite (1.11, 2.55, 
2.14) con el uso de la fórmula de distancia: 


d = V(x = 1.11)? + (y — 2.55) + (z — 2.14)? 
Combinar estos resultados conduce a la ecuación 
(x= 1.11} + (y — 2.55) + (z — 2.14)? = 0.47°(t — 1.29) (1) 


Al desarrollar, simplificar y reordenar, se encuentra que la ecuación (1) se convierte en 
2.22x + 5.10y + 4.28z — 0.57t = x? + y? + 2° — 0.221” + 11.95 


De igual modo, puede obtener una ecuación correspondiente para cada uno de los otros 
tres satélites. Termina con un sistema de cuatro ecuaciones con x, y, Z y t: 


2.22x + 5.10y + 4.28z — 0.57t = x? + y? + z? — 0.221? + 11.95 
5.74x + 2.867 — 0.581 = x? + y? + 220,227 + 9.90 

2.16y + 4.587 — 1.21t= x? + y? + 20.224 + 4.74 
3.08x + 2.02y + 2.46z — 1.79 = x? + y? + 2? — 0.22 + 1.26 


No son ecuaciones lineales, pero los términos no lineales son los mismos en cada ecua- 
ción. Si resta la primera ecuación de cada una de las otras tres ecuaciones, obtiene un sis- 
tema lineal: 


3.52x — 5.10y — 1.42z — 0.01t= 2.05 
—2.22x — 2.94y + 0.30z — 0.64t = 7.21 
0.86x — 3.08y = 1.82z — 1.22f = —10.69 


La matriz aumentada se reduce por renglones a 


3.52 —5.10 —1.42 —0.01| —2.05 1 0 0 0.36| 2.97 
2.22 —2.94 0.30 —0.64| 7.21 |>|0 1 0 0.03|0.81 
0.86 —3.08 =1:82 —1.22|—10.69 0 0 1 0.79|5.91 


lr í Dti 


a tp 
(Gol A A CE A) 


que se simplifica en la ecuación cuadrática 
0.541? — 6.65t + 20.32 = 0 


Existen dos soluciones: 
t=6.74 y t=5.60 


Al sustituir en (2), se encuentra que la primera solución corresponde a (x, y, z) = (0.55, 
0.61, 0.56) y la segunda solución a (x, y, z) = (0.96, 0.65, 1.46). Claramente, la segunda 
solución no está sobre la esfera unitaria (Tierra), de modo que se le rechaza. La pri- 
mera solución produce x° + y? + z? = 0.99, así que se satisface que, dentro de un error 
de redondeo aceptable, sus coordenadas se ubican como (0.55, 0.61, 0.56). 

En la práctica, los GPS toman en cuenta muchos más factores, como el hecho de que 
la superficie de la Tierra no es exactamente esférica, de modo que se necesitan refina- 
mientos adicionales que involucran técnicas como la aproximación por mínimos cua- 
drados (vea el capítulo 7). Además, los resultados de los cálculos GPS se convierten de 
coordenadas rectangulares (cartesianas) a latitud y longitud, un ejercicio interesante en 
sí mismo y que involucra incluso a otras ramas de las matemáticas. 
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CAS 


Los métodos directos para resolver sistemas lineales, con el uso de operaciones elemen- 
tales de renglón, conducen a soluciones exactas en muchos casos, pero están sujetas a 
errores debido a factores de redondeo y otros, como se ha visto. La tercera vía en el “tri- 
vium” lleva por una ruta de hecho muy diferente. En esta sección se exploran los méto- 
dos que proceden iterativamente al generar sucesivamente sucesiones de vectores que 
aproximan una solución para un sistema lineal. En muchas instancias (como cuando la 
matriz coeficiente es dispersa, esto es: contiene muchas entradas cero), los métodos ite- 
rativos pueden ser más rápidos y más precisos que los métodos directos. Además, los mé- 
todos iterativos pueden detenerse siempre que la solución aproximada que generen sea 
suficientemente precisa. Asimismo, los métodos iterativos con frecuencia se benefician 
de la imprecisión: en realidad, el error de redondeo puede acelerar su convergencia hacia 
una solución. 

Se explorarán dos métodos iterativos para resolver sistemas lineales: el método de Ja- 
cobi y un refinamiento del mismo, el método de Gauss-Seidel. En todos los ejemplos 
se considerarán sistemas lineales con el mismo número de variables que de ecuaciones y 
se supondrá que hay una solución única. El interés es encontrar esta solución mediante 
métodos iterativos. 


Ejemplo 2.37 


Carl Gustav Jacobi (1804-1851) fue 
un matemático alemán que realizó 
importantes aportaciones a muchos 
campos de las matemáticas y la 
física, incluidas geometría, teoría de 
números, análisis, mecánica y 
dinámica de fluidos. Aunque gran 
parte de su trabajo fue en matemáti- 
cas aplicadas, Jacobi creía en la im- 
portancia de hacer matemáticas 
puras. Excelente profesor, dio cáte- 
dra en las Universidades de Berlín y 
Königsberg, y fue uno de los más 
famosos matemáticos de Europa. 


Considere el sistema 
7147 >= 3 
3% = 3%) = =7 


El método de Jacobi comienza con la resolución de la primera ecuación para x, y la se- 
gunda ecuación para x,, para obtener 


5+x 
x= Ea 
(1) 
7 + 3X 
X= —— ~~ 
5 


Ahora se necesita una aproximación inicial a la solución. Es evidente que no importa 
cuál sea esta aproximación inicial, así que podría tomarse x, = 0, x, = 0. Estos valores se 
usan en las ecuaciones (1) para obtener nuevos valores de x, y x,: 


5+0 5 
x= = > = 0.714 
7 7 
7+3:0 7 
x= === 1.400 
5 5 


Ahora se sustituyen estos valores en (1) para obtener 


5+1.4 


x= = 0.914 


7H 
AA 1,829: 

(escritas con tres lugares decimales). Este proceso se repite (con los anteriores valores de 
X, y X; para obtener nuevos valores de x, y x,), lo que produce la sucesión de aproxima- 
ciones dadas en la tabla 2.12. 


x= 


El método de Gauss-Seidel recibe su 
nombre en honor de C. F. Gauss y 
Philipp Ludwig von Seidel (1821- 
1896). Seidel trabajó en análisis, teo- 
ría de probabilidad, astronomía y 
óptica. Por desgracia, sufrió de pro- 
blemas oculares y se retiró a una 
edad joven. El ensayo en el que des- 
cribió el método ahora conocido 
como de Gauss-Seidel se publicó en 
1874. Gauss, al parecer, ¡no estaba al 
tanto del método! 
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Tabla 2.12 
n 0 1 2 3 4 5 6 
xı 0 0.714 0.914 0.976 0.993 0.998 0.999 
x 0 1.400 1.829 1.949 1.985 1.996 1.999 


ña se llaman iterados, de modo que, por ejemplo, cuando 


Los vectores sucesivos | 
X2 


0.993 
n = 4, el cuarto iterado es f a Puede ver que los iterados de este ejemplo se 


1 
aproximan a p | , que es la solución exacta del sistema dado. (Compruébelo. ) 


En este caso se dice que el método de Jacobi converge. 


me d 


El método de Jacobi calcula los iterados sucesivos en un sistema de dos variables, de 
acuerdo con el patrón cruzado que se muestra en la tabla 2.13. 


Tabla 2.13 
n 0 1 2 3 


Antes de considerar el método de Jacobi en el caso general, observe una modificación 
del mismo que con frecuencia converge con más rapidez a la solución. El método de 
Gauss-Seidel es igual que el método de Jacobi, excepto que usa cada nuevo valor tan 
pronto como se puede. De este modo, en el ejemplo, comience por calcular x, = (5 + 0)/7 
5 = 0.714 como antes, pero ahora use este valor de x, para obtener el siguiente valor 
de Xx): 


7+3-5 
x = ——_ = 1.829 
5 

Luego use este valor de x, para recalcular x, y así sucesivamente. Esta vez los iterados se 
muestran en la tabla 2.14. 

Observe que el método de Gauss-Seidel converge más rápido hacia la solución. Esta 
vez los iterados se calculan de acuerdo con el patrón en zigzag que se muestra en la tabla 
2.15. 


Tabla 2.14 
n 0 1 2 3 4 5 
xı 0 0.714 0.976 0.998 1.000 1.000 
dz 0 1.829 1.985 1.999 2.000 2.000 
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Tabla 2.15 
n 0 1 2 3 
X 


A A A, 


*, 


El método de Gauss-Seidel también tiene una agradable interpretación geométrica 
en el caso de dos variables. Puede considerar a x, y x, como las coordenadas de puntos en 
el plano. El punto de partida es el punto correspondiente a la aproximación inicial (0, 0). 
El primer cálculo produce x, = He modo que se avanza al punto ( 20) = (0.714, 0). 
Después se calcula x, = £= 1.829, que avanza hacia el punto (3, £) = (0.714, 1.829). Al 
continuar de esta forma, los cálculos del método de Gauss-Seidel dan lugar a una suce- 
sión de puntos, cada uno de los cuales difiere del punto anterior en exactamente una co- 
ordenada. Si se trazan las rectas 7x, — x, = 5 y 3x, — 5x, = —7 correspondientes a las 
dos ecuaciones dadas, se descubre que los puntos calculados arriba caen alternativa- 
mente en las dos rectas, como se muestra en la figura 2.27. Más aún, se aproximan al 
punto de intersección de las rectas, que corresponde a la solución del sistema de ecua- 
ciones. ¡Esto es lo que significa convergencia! 


Figura 2.27 


Iterados convergentes 


Los casos generales de los dos métodos son análogos. Dado un sistema de n ecuacio- 
nes lineales con n variables, 


AX, + AX + + AX = bi 
aX + 09%) + + aX = b (2) 
dak T apo Faea 


la primera ecuación se resuelve para x}, la segunda para x,, etcétera. Entonces, al co- 
menzar con una aproximación inicial, se usan estas nuevas ecuaciones para actualizar 
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iterativamente cada variable. El método de Jacobi usa todos los valores en la k-ésima ite- 
ración para calcular el (k + 1)-ésimo iterado, mientras que el método de Gauss-Seidel 
siempre usa el valor más reciente de cada variable en cada cálculo. El ejemplo 2.39 más 
adelante ilustra el método de Gauss-Seidel en un problema de tres variables. 

En este punto, acaso tenga algunas preguntas y preocupaciones acerca de estos mé- 
todos iterativos. (¿Las tiene?) Muchas vienen a la mente: ¿estos métodos deben conver- 
ger? Si no, ¿cuándo convergen? Si convergen, ¿deben converger a la solución? La res- 
puesta a la primera pregunta es no, como ilustra el ejemplo 2.38. 


Ejemplo 2.38 


Aplique el método de Gauss-Seidel al sistema 
xx x= 1 
2 += 5 
con aproximación inicial ol 
Solución Al reordenar las ecuaciones se obtiene 


x=1>+x 
5= 2% 


X2 


»-—> Los primeros iterados se proporcionan en la tabla 2.16. (Compruébelos.) 
x 2 
La solución real al sistema dado es | | = | | Claramente, los iterados en la tabla 
X 
2.16 no se aproximan a este punto, como la figura 2.28 deja gráficamente claro en un 
ejemplo de divergencia. 
| > X1 
—4 
Tabla 2.16 
n 0 1 2 3 4 5 
x 0 1 4 -2 10 —14 
X 0 3 =3 9 =15 33 Figura 2.28 


Iterados divergentes 
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De modo que, ¿cuándo convergen estos métodos iterativos? Por desgracia, la res- 
puesta a esta pregunta es más bien complicada. Se le responderá por completo en el ca- 
pítulo 7, pero por ahora se dará una respuesta parcial, sin demostración. 

Sea A la matriz n X n 


A Ap Ain 
A= la an Gn 
An an Ann 


Se dice que A es estrictamente diagonal dominante si 


la] > la| + |a| ++ + janl 


laz] > laz] + |a| +++ + janl 


| > (8,,1] F |an] porem gfe |a 


sal 


Esto es: el valor absoluto de cada entrada diagonal a, ;, 422 ..., A„„ es mayor que la suma 
de los valores absolutos de las entradas restantes en dicho renglón. 


Teorema 2.9 


Si un sistema de n ecuaciones lineales con n variables tiene una matriz coeficiente 
estrictamente diagonal dominante, entonces tiene una solución única y tanto el mé- 
todo de Jacobi como el de Gauss-Seidel convergen en ella. 


Comentario ¡Atención! Este teorema es una implicación unidireccional. El hecho 
de que un sistema no sea estrictamente diagonal dominante no significa que los métodos 
iterativos diverjan. Pueden o no converger. (Vea los ejercicios 15-19.) De hecho, existen 
ejemplos en los que uno de los métodos converge y el otro diverge. Sin embargo, sí al- 
guno de los métodos converge, entonces debe converger en la solución: no puede con- 
verger en algún otro punto. 


Teorema 2.10 


Si el método de Jacobi o el de Gauss-Seidel convergen para un sistema de n ecua- 
ciones lineales con n variables, entonces debe converger en la solución del sistema. 


Demostración Se ilustrará la idea detrás de la demostración al bosquejarla para el caso 
del método de Jacobi, mediante el sistema de ecuaciones del ejemplo 2.37. La demostra- 
ción general es similar. 

Convergencia significa que “conforme aumentan las iteraciones, los valores de los 
iterados se acercan más a un valor límite”. Esto significa que x; y X, convergen en r y s, 
respectivamente, como se muestra en la tabla 2.17. 


x r o, . ; 
Debe demostrar que | l = | | es la solución del sistema de ecuaciones. En otras 
Xx, s 
palabras, en la (k + 1)-ésima iteración, los valores de x, y x, deben permanecer igual que 


en la k-ésima iteración. Pero los cálculos producen x, = (5 + x,)/7 = (5 + s)/7 y x, = 
(7 + 3x,)/5 = (7 + 3r)/5. Por tanto, 
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Tabla 2.17 
n k k+1 k+2 
Xi r r r 
Xx, s s s 
5 +s 73r 
=r y =s 
7 5 
Al reordenar, se ve que 
I= s= 5 
3r — 5s = -7 


Por tanto, x, = r, x, = s satisfacen las ecuaciones originales, como se requiere. 
—— 

Por ahora puede preguntarse: si los métodos iterativos no siempre convergen en la 
solución, ¿qué tan buenos son? ¿Por qué no se usa la eliminación gaussiana? Primero, se 
vio que la eliminación gaussiana es sensible a errores de redondeo, y esta sensibilidad 
puede conducir a imprecisiones o incluso a respuestas enormemente equivocadas. Ade- 
más, incluso si la eliminación gaussiana no se desviará, una solución no puede mejorarse 
una vez encontrada. Por ejemplo, si se usa la eliminación gaussiana para calcular una so- 
lución a dos lugares decimales, no hay forma de obtener la solución a cuatro lugares de- 
cimales, excepto comenzar nuevamente y trabajar con una precisión creciente. 

En contraste, puede lograrse una precisión adicional con los métodos iterativos al 
simplemente hacer más iteraciones. Para sistemas grandes, en particular para aquellos 
con matrices de coeficientes dispersos, los métodos iterativos son mucho más rápidos 
que los métodos directos cuando se implementan en una computadora. En muchas apli- 
caciones, los sistemas que surgen son estrictamente diagonales dominantes, y por tanto 
está garantizado que los métodos iterativos converjan. El siguiente ejemplo ilustra una 
de tales aplicaciones. 


Ejemplo 2.39 


> 
Suponga que se calienta el borde de una placa metálica a una temperatura constante, 
como se muestra en la figura 2.29. 


100° 
50° 


Figura 2.29 


Una placa de metal caliente 0° 
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Con el tiempo, la temperatura en los puntos interiores llegará al equilibrio, donde 
puede demostrarse que se cumple la siguiente propiedad: 


z= 
La temperatura en cada punto interior P sobre una placa es el promedio de las tem- 
peraturas en la circunferencia de cualquier círculo con centro en P dentro de la 
placa (figura 2.30). 


Aplicar esta propiedad en un ejemplo real requiere técnicas de cálculo. Como alter- 
nativa, puede aproximarse la situación al superponer a la placa una rejilla o malla, que 
tenga un número finito de puntos interiores, como se muestra en la figura 2.31. 


50° 


50° 


Figura 2.31 
Versión discreta del problema de 
la placa caliente 


A continuación se enuncia el análogo discreto de la propiedad promedio que go- 
bierna las temperaturas de equilibrio: 


La temperatura en cada punto interior P es el promedio de las temperaturas en los 
puntos adyacentes a P. 


Para el ejemplo que se muestra en la figura 2.31, hay tres puntos interiores, y cada 
uno es adyacente a otros cuatro puntos. Sean t,, t, y t, las temperaturas de equilibrio 
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de los puntos interiores, como se muestra. Entonces, por la propiedad de temperatura 
promedio, se tiene 


100 + 100 + £, + 50 


y 4 
t+t+0+50 
p= (3) 
4 
100 + 100 +0 +6 
po 4 
o 44 b = 250 


-t +44- h= 50 
— t +4 = 200 


Note que este sistema es estrictamente diagonal dominante. Observe también que las 
ecuaciones (3) están en la forma requerida por la iteración de Jacobi o Gauss-Seidel. Con 
una aproximación inicial de t, = 0, t, = 0, t, = 0, el método de Gauss-Seidel produce los 
siguientes iterados. 


_ 100 +100+0+50 _ 


Iteración 1: ti 4 62.5 
625+0+0+50 
y = a = 28.125 
100 + 100 + 0 + 28.125 
3= = 57.031 
4 
. 100 + 100 + 28.125 + 50 
Iteración 2: t = 4 = 69.531 
69.531 + 57.031 + 0 + 50 
3 = = 44.141 
4 
100 + 100 + 0 + 44,141 
b = = 61.035 


4 


A continuación, se encuentran los iterados que se mencionan en la tabla 2.18. Se trabaja 
con una precisión de cinco dígitos significativos y se detiene cuando dos iterados sucesi- 
vos concuerdan dentro de 0.001 en todas la variables. 

Por ende, las temperaturas de equilibrio en los puntos interiores son (con una preci- 
sión de 0.001): t, = 74.108, t, = 46.430, y t, = 61.607. (Compruebe estos cálculos.) 

Al usar una retícula más fina (con más puntos interiores), puede obtener una infor- 
mación tan precisa como desee acerca de las temperaturas de equilibrio en varios pun- 
tos sobre la placa. 


Tabla 2.18 
n o0 1 2 3 -> 7 8 
ti 0 62.500 69.531 73:535 Sas 74.107 74.107 
b 0 28.125 44.141 46.143 Ei 46.429 46.429 
t 0 


57:031 61.035 61.536 mes 61.607 61.607 
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Í Ejercicios 2.9 


CAS y 

En los ejercicios 1-6, aplique el método de Jacobi al sistema 
dado. Tome el vector cero como la aproximación inicial y tra- 
baje con una precisión de cuatro dígitos significativos hasta 
que dos iterados sucesivos concuerden dentro de 0.001 en cada 
variable. En cada caso, compare su respuesta con la solución 
exacta que encuentre usando cualquier método directo de su 
elección. 


l. 74- x= 6 2.2%, +16=5 
Xi = 3%, = 4 X 
3. 45x — 0.5% = 1 
x —3.5x= —1 


=x=1l 


4. 204 + x= x=17 
x — l0% + x=13 
=x + x% + 10% = 18 

5. 3i 2 =1 
x+4o+ x=l 

x% +t 3x% = 1 


6. 3x1 — Xx, = 
1, F 30. == Y 


o a= 


| 
=.. oOme 


=% F 3X; 


En los ejercicios 7-12, repita el ejercicio dado usando el mé- 
todo de Gauss-Seidel. Tome el vector cero como la aproxima- 
ción inicial y trabaje con una precisión de cuatro dígitos signi- 
ficativos hasta que dos iterados sucesivos concuerden dentro de 
0.001 en cada variable. Compare el número de iteraciones re- 
queridas por los métodos de Jacobi y de Gauss-Seidel para al- 
canzar tal solución aproximada. 


7. Ejercicio 1 8. Ejercicio 2 


9. Ejercicio 3 10. Ejercicio 4 


11. Ejercicio 5 12. Ejercicio 6 


En los ejercicios 13 y 14, dibuje diagramas para ilustrar la 
convergencia del método de Gauss-Seidel con el sistema dado. 


13. El sistema del ejercicio 1 


14. El sistema del ejercicio 2 


En los ejercicios 15 y 16, calcule los primeros cuatro iterados, 
con el vector cero como la aproximación inicial, para demos- 
trar que el método de Gauss-Seidel diverge. Luego demuestre 
que las ecuaciones pueden reordenarse para dar una matriz de 
coeficientes estrictamente diagonal dominante y aplique el 


método de Gauss-Seidel para obtener una solución aproxi- 
mada que sea precisa hasta dentro de 0.001. 


15. x = 2% = 3 16. x — 4x, + 2x3 = 2 
3x, + 2%, = 1 2x, + 4x; = 
6%, = x= 2 = 1 


17. Dibuje un diagrama para ilustrar la divergencia del mé- 
todo de Gauss-Seidel en el ejercicio 15. 


En los ejercicios 18 y 19, la matriz de coeficientes no es estric- 
tamente diagonal dominante, ni pueden reordenarse las ecua- 
ciones para hacerlas de ese modo. Sin embargo, tanto el mé- 
todo de Jacobi como el de Gauss-Seidel convergen de cualquier 
forma. Demuestre que esto es verdadero para el método de 
Gauss-Seidel, comience con el vector cero como la aproxima- 
ción inicial y obtenga una solución que sea precisa hasta den- 
tro de 0.01. 


18. —4x, + 5x, = 14 
x — 3% = -7 
19. 5x, = 2x, + 3x3= -8 
x + 4x — 4x = 102 
—2x, — 2x, + 4x, = —90 
20. Continúe con las iteraciones en el ejercicio 18 hasta ob- 


tener una solución que sea precisa hasta dentro de 
0.001. 


21. Continúe con las iteraciones en el ejercicio 19 hasta ob- 
tener una solución que sea precisa hasta dentro de 
0.001. 


En los ejercicios 22-24, la placa metálica tiene las temperatu- 
ras constantes que se muestran en sus fronteras. Encuentre la 
temperatura de equilibrio en cada uno de los puntos interiores 
indicados al establecer un sistema de ecuaciones lineales y 
aplicar el método de Jacobi o el de Gauss-Seidel. Obtenga una 
solución que sea precisa hasta dentro de 0.001. 


23. 


0° 0° 
ti b 
0° + 0° 
100° + 100° 
t3 t4 


100° 100° 


20° 
ti la 
0° + 20° 
40° 100° 
13 t4 


24. 0° 
+ 
40° 100° 


En los ejercicios 25 y 26, se refinan las retículas usadas en los 


ejercicios 22 y 24 para obtener información más precisa acerca 


de las temperaturas de equilibrio en los puntos interiores de 
las placas. Obtenga soluciones que sean precisas hasta dentro 
de 0.001, usando o el método de Jacobi o el de Gauss-Seidel. 


0° 20° 


0° 20° 


40° 100° 


40° 


100° 


40° 40° 100° 100° 


Los ejercicios 27 y 28 demuestran que, a veces, si se tiene 
suerte, la forma de un problema iterativo puede permitir el 
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uso de un poco de intuición para obtener una solución 
exacta. 


27. Una tira estrecha de papel, de 1 unidad de longitud, se 
coloca a lo largo de una recta numérica, de modo que 
sus extremos están en 0 y 1. El papel se dobla a la mitad, 
con el extremo derecho sobre el izquierdo, de modo que 
sus extremos están ahora en 0 y E, A continuación, se 
dobla nuevamente a la mitad, esta vez con el extremo iz- 
quierdo sobre el derecho, de modo que sus extremos 
están en į y 5. La figura 2.32 muestra este proceso. Siga 
doblando el papel a la mitad, alternando derecha sobre 
izquierda e izquierda sobre derecha. Si pudiera conti- 
nuar indefinidamente, es claro que los extremos del 
papel convergerían en un punto. Este punto es el que se 
quiere encontrar. 


(a) Sea x, el extremo correspondiente al lado izquierdo 
del papel y x, el del extremo derecho. Elabore una 
tabla con los primeros seis valores de [x,, x,] y grafi- 
que los correspondientes puntos sobre ejes coorde- 
nados Xy, X>. 

(b) Encuentre dos ecuaciones lineales de la forma x, = 
ax, + b yx, = cx, + d que determinen los nuevos 
valores de los puntos finales de cada iteración. Di- 
buje las rectas correspondientes en sus ejes coorde- 
nados y demuestre que este diagrama resultaría de 
aplicar el método de Gauss-Seidel al sistema de 
ecuaciones lineales que encontró. (Su diagrama 
debe parecerse al de la figura 2.27, de la página 132.) 

(c) Cambie a representación decimal y siga aplicando el 
método de Gauss-Seidel para aproximar el pun- 
to donde convergen los extremos del papel hasta 
dentro de 0.001 de precisión. 

(d) Resuelva el sistema de ecuaciones exactamente y 
compare sus respuestas. 


28. Una hormiga está parada sobre una recta numérica en el 
punto A. Camina a la mitad hacia el punto B y da 
vuelta. Luego camina la mitad de vuelta al punto A, da 
vuelta nuevamente y camina a la mitad hacia el punto B. 
Y sigue haciendo esto indefinidamente. Sea que el pun- 
to A está en 0 y el punto B en 1. El paseo de la hormiga 
está constituido por una sucesión de segmentos de recta 
que se traslapan. Sea x, el registro de las posiciones de 
los puntos finales izquierdos de dichos segmentos y x, 
sus puntos finales derechos. (Por tanto, comience 
con x, = 0 y x, = 3. Luego se tiene x, = 3 yx, = 3, etcé- 
tera.) La figura 2.33 muestra el inicio del paseo de la 
hormiga. 


(a) Elabore una tabla con los primeros seis valores de [x,, 
x] y grafique los puntos correspondientes en ejes coor- 
denados x}, X,. 


(b) Encuentre dos ecuaciones lineales de la forma x, = ax, 
+ byx = cx, + d que determinen los nuevos valores de 
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1 3 
2 4 
H H 
0 1 
Z a A i 
i 0 1 1 3 
l 4 2 4 
H | 
0 1 1 
2 
| | | H EE EER. 
0 1 1 3 1 0 l 15 2 
4 2 4 4 2 8 4 
Figura 2.32 Figura 2.33 
Doblado de una tira de El paseo de la hormiga 
papel 


los puntos finales en cada iteración. Dibuje las rectas co- 
rrespondientes sobre sus ejes coordenados y demuestre 
que este diagrama resultaría de aplicar el método de 
Gauss-Seidel al sistema de ecuaciones lineales que en- 
contró. (Su diagrama debe parecerse al de la figura 2.27 
de la página 132.) 


(c) Cambie a representación decimal y siga aplicando el 


método de Gauss-Seidel para aproximar los valores en 
los cuales convergen x; y X, hasta una precisión dentro 
de 0.001. 


(d) Resuelva el sistema de ecuaciones exactamente y com- 


pare sus respuestas. Interprete sus resultados. 


conjunto generador, 96 iterado, 131 


convergencia, 131-132 
divergencia, 133 74 


matrices equivalentes por renglones, 


sistema de ecuaciones lineales, 64 
sustitución hacia atrás, 67 
sistema consistente, 66 


ecuación lineal, 63 

eliminación de Gauss-Jordan, 79 

eliminación gaussiana, 74 

forma escalonada por renglones, 71 

forma escalonada reducida por 
renglones, 79 

generador de un conjunto de vectores, 
96 


matriz aumentada, 67 

matriz coeficiente, 70 

método de Gauss-Seidel, 130 

método de Jacobi, 130 

operaciones elementales con renglones, 
72 

pivote, 72 

rank de una matriz, 78 


sistema homogéneo, 82 

sistema inconsistente, 66 

teorema del rank, 78 

variable libre, 77 

vectores linealmente dependientes, 99 

vectores linealmente independientes, 
99 

variable pivote (1 pivote), 77-79 


1. Marque cada uno de los siguientes enunciados como 
verdadero o falso: 


(a) Todo sistema de ecuaciones lineales tiene una solu- 


ción. 
(b) Todo sistema homogéneo de ecuaciones lineales 
tiene una solución. 


(c) Si un sistema de ecuaciones lineales tiene más varia- 
bles que ecuaciones, entonces tiene un número infi- 


nito de soluciones. 


(d) Si un sistema de ecuaciones lineales tiene más ecua- 


ciones que variables, entonces no tiene solución. 


(e) Determinar si b está en gen(a}, . . . , a,) es equiva- 
lente a determinar si el sistema [A | b] es consis- 
tente, donde A = la, +: a]. 

(f) En R*, gen(u, v) siempre es un plano que pasa por el 
origen. 

(g) En R’, si los vectores u y v distintos de cero no son 
paralelos, entonces son linealmente independientes. 

(h) En RR”, si un conjunto de vectores puede dibujarse 
punta a origen, uno después del otro, de modo que 
se forme una trayectoria cerrada (polígono), enton- 
ces los vectores son linealmente dependientes. 


10 


(i) Si un conjunto de vectores tiene la propiedad de que 
ningún par de vectores en el conjunto son múltiplos 
escalares mutuos, entonces el conjunto de vectores 
es linealmente independiente. 

Si en un conjunto de vectores existen más vectores 
que el número de elementos en cada vector, enton- 
ces el conjunto de vectores es linealmente depen- 


0) 


diente. 
. Encuentre el rank de la matriz 
1 -2 0 3 2 
3 —1 1 3 4 
3 4 2 =$ 2 
0. =5=1 6 2 


. Resuelva el sistema lineal 
x+ y=2z=4 
FIS 227 
2 + y=3z=7 


. Resuelva el sistema lineal 
3w + 8x— 18y + z= 35 
w+2x= 4y =11 
w+3x-= 7y+z=10 
. Resuelva el sistema lineal 
2x + 3y=4 
x+2y=3 
sobre Z,. 
. Resuelva el sistema lineal 
3x +2y=1 
x + 4y=2 
sobre Z+. 
. ¿Para qué valor(es) de k es inconsistente el sistema lineal 
2 |1 
con matriz aumentada | ? 
1 2kļ|1 


. Encuentre ecuaciones paramétricas para la recta de in- 
tersección de los planos x + 2y + 3z = 4 y 5x + 6y + 7z 
=8. 


. Encuentre el punto de intersección de las siguientes rec- 
tas, si existe. 
x 1 1 x 5 dl 
y|=|2|+s -1| y lyl=|-2|++* 1 
Z 3 2 Z —4 1 
3 1 
. Determine si | 5 | está en el generador de | 1 
=1 3 


=2 
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12. 


13. 


14. 


15. 


16. 


17. 


18. 


19. 


20. 


Repaso del capítulo 141 


. Encuentre la ecuación general del plano generado por 


1 3 

1 |y] 2 

1 1 
2 1 3 

Determine si Lis h =1 1 9 [son linealmente 
=3 —2 —2 


independientes. 


Determine si R? = gen(u, v, w) si: 


1 1 0 
(a) u=|1|,v=|0|,w= 
0 1 1 
1 =1 0 
(b)u=|-—1|,v= 0|,w=|-1 
0 1 1 


Sean a,, a, a, vectores linealmente independientes en 

R’, y sea A = [a, a, ay]. ¿Cuál de los siguientes enun- 

ciados es verdadero? 

(a) La forma escalonada reducida por renglones de A es 
I; 

(b) El rank de A es 3. 

(c) El sistema [A | b] tiene una solución única para 
cualquier vector b en R°. 

(d) (a), (b) y (c) son verdaderos. 

(e) (a) y (b) son verdaderos, pero (c) no lo es. 


Sean a,, a, a, vectores linealmente dependientes en R’, 
no todos cero, y sea A = la, a, a,]. ¿Cuáles son los po- 
sibles valores del rank de A? 

¿Cuál es el rank máximo de una matriz de 5 X 3? ¿Cuál 
es el rango mínimo de una matriz de 5 X 3? 

Demuestre que, si u y v son vectores linealmente inde- 
pendientes, entonces también lo son u + vyu — v. 
Demuestre que gen(u, v) = span(u, u + v) para cuales- 
quiera vectores u y v. 

Con la finalidad de que un sistema lineal con matriz au- 


mentada [A | b] sea consistente, ¿qué debe ser cierto 
acerca de los ranks de A y [A | b] ? 


di. 1 1 1.0 —1 
¿Las matrices | 2 3 —1|y|1 1 1 | son 
-=1 4 1 0 1 3 


equivalentes por renglones? ¿Por qué sí o por qué no? 


Nosotros [Halmos y Kaplansky] 
compartimos una filosofía acerca 
del álgebra lineal: pensamos libres 
de bases, escribimos libres de 
bases, pero a la hora de la verdad, 
cerramos la puerta de la oficina y 
calculamos con matrices como 


enajenados. 


—Irving Kaplansky 


en Paul Halmos: Celebrating 50 


Years of Mathematics 


J. H. Ewing y F. W. Gehring, eds., 
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Springer-Verlag, 1991, p. 88 


3.0 Introducción: matrices en acción 


En este capítulo se estudiarán las matrices por derecho propio. Ya se usaron matrices, en 
forma de matrices aumentadas, para registrar información acerca de los sistemas de 
ecuaciones lineales y para ayudar a agilizar los cálculos que los involucran. Ahora verá 
que las matrices tienen propiedades algebraicas propias, lo que permite realizar cálculos 
con ellas, sujetas a las reglas del álgebra matricial. Más aún, observará que las matrices no 
son objetos estáticos que registran información y datos; en vez de ello, representan cier- 
tos tipos de funciones que “actúan” sobre los vectores y los transforman en otros vecto- 
res. Tales “transformaciones matriciales” comenzarán a tener un papel clave en el estu- 
dio del álgebra lineal y arrojarán nueva luz en lo que ya aprendió acerca de los vectores y 
los sistemas de ecuaciones lineales. Además, las matrices surgen en muchas formas dife- 
rentes a las de las matrices aumentadas; al final de este capítulo se explorarán algunas de 
las muchas aplicaciones de las matrices. 

En esta sección se considerarán algunos ejemplos simples para ilustrar cómo las ma- 
trices pueden transformar a los vectores. En el proceso tendrá un primer vistazo de la 
“aritmética matricial”. 

Considere las ecuaciones 


y= Xx, + 2% 


1 
J= 3x, a 


Puede considerar que estas ecuaciones describen una transformación del vector 


yı 


} Si se denota con F la matriz de coeficientes del lado 
Y 


H | 
x= en el vector y = 
X2 


1 2 m : 
derecho, entonces F = | l y puede reescribir la transformación como 


Y 0 3]lx 
o, de manera más sucinta, y = Fx. (Piense en esta expresión como el análogo de la nota- 


ción funcional y = f(x) a la que está acostumbrado: x aquí es la “variable” independiente, 
y es la “variable” dependiente y F es el nombre de la “función”.) 
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Por tanto, six = | el entonces las ecuaciones (1) producen 


y =—-2+2-1=0 2] 
0) ys 
y= 


l 
W 
i 
= 
II 


O 1 2]-2 
Esta expresión puede escribirse como al = h 4 | al 


Problema 1 Calcule Fx para los siguientes vectores x: 


x= |] pasli x= 71] ar 


Problema 2 Las puntas de los cuatro vectores x del problema 1 se ubican en las cua- 
tro esquinas de un cuadrado en el plano x,x,. Dibuje este cuadrado y marque sus esqui- 
nas A, B, C y D, que corresponden a los incisos (a), (b), (c) y (d) del problema 1. 

En ejes coordenados separados (marcados y, y y,), dibuje los cuatro puntos determi- 
nados por Fx en el problema 1. Marque estos puntos A”, B', C' y D'. Haga la suposición 
(razonable) de que el segmento de recta AB, se transforma en el segmento de recta A'B' 
y del mismo modo para los otros tres lados del cuadrado ABCD. ¿Qué figura geométrica 
se representa mediante A'B'C'D'? 


0 
Problema 3 El centro del cuadrado ABCD es el origen 0 = | | ¿Cuál es el centro 
de A'B'C'D'? ¿Qué cálculo algebraico confirma esto? E 
Ahora considere las ecuaciones 


z5 Y1 = Jz (2) 
zZ =-2y 
21 


| Puede abreviar esta trans- 
Z2 


que transforman un vector y = la en el vector z = | 
Y 


formación como z = Gy, de donde 


Problema 4 Va a descubrir cómo G transforma a la figura A*B'C'D'. Calcule Gy 
para cada uno de los cuatro vectores y que calculó en el problema 1. [Esto es: calcule z = 
G(Fx). Puede reconocer esta expresión como análoga a la composición de funciones con 
la que está familiarizado.] Llame a los puntos correspondientes A”, B”, C" y D”, y bos- 
queje la figura A”B"C"D” sobre los ejes coordenados 2,2). 

Problema 5 Al sustituir las ecuaciones (1) en las ecuaciones (2), se obtienen ecua- 
ciones para Z, y Z, en términos de x; y x,. Si denota con H la matriz de estas ecuaciones, 
entonces se tiene z = Hx. Dado que también se tiene z = GFx, es razonable escribir 


H=GF 


¿Puede ver cómo las entradas de H se relacionan con las entradas de F y G? 

Problema 6 Repita el proceso anterior en forma inversa: primero transforme el 
cuadrado ABCD, usando G, para obtener la figura A*B*C*D*. Luego transforme la fi- 
gura resultante, con F, para obtener A** BF C** D**. [ Nota: no se preocupe aquí por las 
“variables” x, y y z. Simplemente sustituya las coordenadas de A, B, C y D en las ecuacio- 
nes (2) y luego sustituya los resultados en las ecuaciones (1).] ¿AFEBFECHEDEE y 
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Aunque los números por lo gene- 
ral se elegirán del conjunto R de 
números reales, también pueden 
tomarse del conjunto C de núme- 
ros complejos o de Z, donde p es 
primo. 


Técnicamente, hay distinción entre 
matrices renglón/columna y vecto- 
res, pero aquí no se profundizará en 
dicha distinción. Sin embargo, sí se 
distinguirá entre matrices/vectores 
renglón y matrices/vectores columna. 
Esta distinción es importante, al 
menos, para cálculos algebraicos, 
como se demostrará. 


A”B"C"D" son iguales? ¿Qué le dice esto acerca del orden en que se realizan las transfor- 
maciones F y G? 


Problema 7 Repita el problema 5 con las matrices generales 
F= le al G= ls a y H= lo a 
fa fa 821 82 hi hn 
Esto es: si las ecuaciones (1) y las ecuaciones (2) tienen coeficientes como especifican F y 
G, encuentre las entradas de H en términos de las entradas de F y G. El resultado será una 
fórmula para el “producto” H = GF. 
Problema 8 Repita los problemas 1-6 con las siguientes matrices. (Su fórmula del 


problema 7 le ayudará a acelerar los cálculos algebraicos). Note cualquier similitud o di- 
ferencia que considere significativa. 


() E! aos | >] () E= |; TeL i 
or=fi E A] wr=| Ape l 


Operaciones con matrices 


Aunque ya se ha topado con las matrices, se comienza por enunciar una definición for- 
mal y registrar algunos hechos para futura referencia. 


Definición Una matriz es un arreglo rectangular de números llamados entra- 
das, o elementos, de la matriz. 


Los siguientes son ejemplos de matrices: 


2 51 12 —1 
1 2 v5 -1 0 
; a 4j, JE 1 1 1} 6.9 0 4.4 |, [7] 
0 3 2 T 2 
17 -73 9 8.5 


El tamaño de una matriz es una descripción de los números de renglones y columnas 
que tiene. Una matriz se llama de m X n (dígase “m por n”) si tiene m renglones y n co- 
lumnas. Por tanto, los ejemplos anteriores son matrices de tamaños 2 X 2,2 X 3,3 X 1, 
1xX4,3X3y1X 1, respectivamente. Una matriz de 1 X n se llama matriz renglón (o 
vector renglón), y una matriz de n X 1 se llama matriz columna (o vector columna). 


Se usa la notación de doble subíndice para referirse a las entradas de una matriz A. La 
entrada de A en el renglón í y la columna j se denota mediante a. Por tanto, si 


I g =] 
A= 
0 5 4 
entonces 4}, = —1 y a,, = 5. (En ocasiones se usa la notación A, de manera intercam- 
biable con a.) Por tanto, de manera compacta, una matriz A se puede denotar mediante 


a] (o [a,. si es importante especificar el tamaño de A, aunque el tamaño por lo ge- 
y y¿mXn P P q p 8 
neral será claro a partir del contexto). 
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Con esta notación, una matriz general A de m X n tiene la forma 


Au An ` An 
A= 41 An l oo An 
Am Am K Amn 
Si las columnas de A son los vectores a,,a,,...,a,, entonces A se puede representar como 
A= (a, a 5 a, 


Si los renglones de A son A,,A,,...,A,,, entonces A se puede presentar como 


m’ 


A; 
A= A 
Ar 
Las entradas diagonales de A son a, ;, 43» Ay, ..., y si m = n (esto es, si A tiene el mismo 


número de renglones que de columnas), entonces A es una matriz cuadrada. Una ma- 
triz cuadrada cuyas entradas no diagonales sean todas cero es una matriz diagonal. Una 
matriz diagonal cuyas entradas diagonales sean todas iguales es una matriz escalar. Si el 
escalar en la diagonal es 1, la matriz escalar es una matriz identidad. 
Por ejemplo, sean 
3 0 0 1 0 0 
2 50 3 1 
A= y, B= , C=|0 6 0 y D=|0 1 0 
=1 4 1 4 5 
0 0 2 0 0 1 


Las entradas diagonales de A son 2 y 4, pero A no es cuadrada; B es una matriz cuadrada 
de tamaño 2 X 2, con entradas diagonales 3 y 5; C es una matriz diagonal; D es una ma- 
triz identidad de 3 X 3. La matriz identidad n X n se denota 1, (o simplemente T si su ta- 
maño se entiende). 

Dado que las matrices pueden verse como generalizaciones de vectores (y, de hecho, 
las matrices pueden y deben considerarse como constituidas tanto por vectores renglón 
como columna), muchas de las convenciones y operaciones para vectores se realizan 
sobre las matrices (en una forma obvia). 

Dos matrices son iguales si tienen el mismo tamaño y si sus entradas correspon- 
dientes son iguales. Por tanto, si A = [a y B = [bj], » entonces A = B si y sólo si m 
=ryn = sya;j= b, para todo iy j. 


jlmxn 


Ejemplo 3.1 


Considere las matrices 


a b 2 0 E 
A = , B = y G = 
c d 5 3 5.3 y 
Ni A ni B pueden ser iguales a C (sin importar cuáles sean los valores de x y y), pues A y B 
son matrices de 2 X 2 y Ces de 2 X 3. Sin embargo, A = B si y sólo si a = 2, b = 0,c = 5 y 


na Mi 


Ejemplo3.2 


Considere las matrices 
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A pesar del hecho de que R y C tienen las mismas entradas en el mismo orden, R %C, 
pues Res 1 X 3 y Ces 3 X 1. (Si R y C se leen en voz alta, suenan igual: “uno, cuatro, 
tres”.) Por tanto, la distinción entre matrices/vectores renglón y matrices/vectores co- 


lumna es importante. | 


Para generalizar la suma de vectores, se define la suma de matrices por componentes. Si 
A= la,] y B = [b;] son matrices de m X n, su suma A + B es la matriz de m X n que se 
obtiene al sumar las entradas correspondientes. Por tanto, 


[Igualmente se podría definir A + B en términos de suma vectorial al especificar que 
cada columna (o renglón) de A + B es la suma de las correspondientes columnas (o ren- 
glones) de A y B.] Si A y B no son del mismo tamaño, entonces A + B no está definida. 


> 
Ejemplo 3.3 | Sean 
1 4 0 =3. 1 =l 4 3 
a En 
=2:- 6 5 3 0 2 2 1 
Entonces 
=2 9. =l 
| | 
1 6 7 
pero ni A + Cni B + C están definidas. i 


La definición por componentes de la multiplicación por un escalar no será sorpresa. Si 
A es una matriz m X n y c es un escalar, entonces el múltiplo escalar cA es la matriz m X n 
que se obtiene al multiplicar cada entrada de A por c. De manera más formal, se tiene 


cA lel = eA 


[En términos de vectores, podría estipularse de manera equivalente que cada columna (o 
renglón) de cA es c veces la correspondiente columna (o renglón) de A.] 


Ejemplo 3.4 


Para la matriz A del ejemplo 3.3, 


2 8 o] 
—4 12 10)” 


24= | 


La matriz (— 1)A se escribe como —A y se llama negativo de A. Como con los vectores, 
puede usar este hecho para definir la diferencia de dos matrices: si A y B tienen el mismo 
tamaño, entonces 


A-B=A+(-B) 
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En ocasiones, los matemáticos son 
como el Humpty Dumpty de 
Lewis Carroll: “Cuando yo uso una 
palabra”, dijo Humpty Dumpty, 
“significa justo lo que quiero que 
signifique, ni más ni menos” (de 
Through the Looking Glass). 


Para las matrices A y B del ejemplo 3.3, 
Err BrE CEIF 
A-B= - = 
=} 06 5 3 0 2 =5 6 3 


Una matriz cuyas entradas sean todas cero se llama matriz cero y se denota O (u 
O,...., Si es importante especificar su tamaño). Debe ser claro que si A es cualquier matriz 
mXn 
y O es la matriz cero del mismo tamaño, entonces 


AFO=ZA=0O+A 


La introducción de la sección 3.0 sugirió que hay un “producto” de matrices que es aná- 
loga a la composición de funciones. Ahora se hará más precisa esta noción. La definición 
que está a punto de proporcionarse generaliza lo que debió descubrir en los problemas 5 
y 7 de la sección 3.0. A diferencia de las definiciones de suma de matrices y multiplica- 
ción por un escalar, la definición del producto de dos matrices no es por componentes. 
Desde luego, no hay nada que impida definir un producto de matrices en forma de com- 
ponentes; por desgracia, tal definición tiene pocas aplicaciones y no es tan “natural” 
como la que ahora se propondrá. 


Definición — Si A es una matriz de m X n y B es una matriz de n X r, entonces el 
producto C = AB es una matriz de m X r. La entrada (i, j) del producto se calcula del 
modo siguiente: 


Ej = OpDy, Y Ab e E E b 


Comentarios 

e Note que A y B no tienen que ser del mismo tamaño. Sin embargo, el número de 
columnas de A debe ser igual al número de renglones de B. Si escribe en orden los tamaños 
de A, B y AB, podrá ver de inmediato si se satisface este requisito. Más aún, puede prede- 
cir el tamaño del producto antes de hacer cálculo alguno, pues el número de renglones de 
AB es igual que el número de renglones de A, mientras que el número de columnas de AB 
es igual que el número de columnas de B, como se muestra a continuación: 


A B = AB 


mXn nXr mXr 


Tamaño de AB 
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e La fórmula para las entradas del producto parece un producto punto, y de hecho 
lo es. Se dice que la entrada (i, j) de la matriz AB es el producto punto del ¡-ésimo 
renglón de A y la j-ésima columna de B: 


F bi by; b,, 
J 
` bz bzj b, 
J 
ai i Ain . E ` 
f ` ` bn Dn bor 
Amı Am2 Amn 


Note que en la expresión c; = apb, + a,b, + += + ayb, los “subíndices exteriores” de 
cada término ab en la suma siempre son i y j, mientras que los “subíndices interiores” 
siempre concuerdan y aumentan de 1 a n. Este patrón se ve claramente si escribe c; 


usando la notación de suma: 


n 
c;= Darby 
k=1 


Calcule AB si 


1 3 -l 
A= y B=| 5 -2 -1 1 

-2 -1 1 
-1 2 0 6 


Solución Dado que A es de 2 X 3 y B es de 3 X 4, el producto AB está definido y será 
una matriz 2 X 4. El primer renglón del producto C = AB se efectúa al tomar el pro- 
ducto punto del primer renglón de A con cada una de las columnas de B por turno. En 
consecuencia, 


a1=1(-9+35) + UiGEl1)=12 


€, =1(0) +3(-2) + (-1)(2) =-8 
c, =1(3) +3(—1)+(—1)(0) =0 
ca =1(=1)+3(1) +(=1)(6) =-4 


El segundo renglón de C se calcula al realizar el producto punto del segundo renglón de 
A con cada una de las columnas de B por turno: 


y = (=2)(—4) + (2065) + (1) =2 
& = (52/10) + (=1)(=2) + (1)(2) =4 
©; = (=2)3) + (=1)(=1) + (1)(0) =-5 
Cy = (72)(=1)+ (DA) +(1)(6) =7 


Por tanto, la matriz producto está dada por 
12. =8 0 —4 
AB = 
2 4 =5 7 
(Con un poco de práctica, deberá hacer estos cálculos mentalmente sin escribir todos los 


detalles como se hizo aquí. Para ejemplos más complicados, es preferible una calcula- 
dora con capacidades matriciales o un sistema algebraico de cómputo.) 
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Antes de avanzar más, se considerarán dos ejemplos que justifican la definición ele- 
gida de multiplicación de matrices. 


Ejemplo 3.7 


z 
Ann y Bert planean ir a comprar frutas para la siguiente semana. Cada uno quiere com- 
prar algunas manzanas, naranjas y uvas, pero en diferentes cantidades. La tabla 3.1 men- 
ciona lo que quieren comprar. Hay dos mercados de frutas cercanos, Sam's y Theo’s, y sus 
precios se proporcionan en la tabla 3.2. ¿Cuánto costará a Ann y Bert hacer sus compras 
en cada uno de los dos mercados? 


Tabla 3.1 Tabla 3.2 
Manzanas Uvas Naranjas Sam's Theo's 
Ann 6 3 10 Manzana $0.10 $0.15 
Bert 4 8 5 Uva $0.40 $0.30 
Naranja $0.10 $0.20 
Solución Si Ann compra en Sam's, gastará 
6(0.10) + 3(0.40) + 10(0.10) = $2.80 
Si compra en Theo's, gastará 
6(0.15) + 3(0.30) + 10(0.20) = $3.80 
Bert gastará 
4(0.10) + 8(0.40) + 5(0.10) = $4.10 
en Sam's y 
4(0.15) + 8(0.30) + 5(0.20) = $4.00 
en Theo's. (Presumiblemente, Ann comprará en SanYs mientras que Bert irá a Theo's.) 
La “forma producto punto” de estos cálculos sugieren que la multiplicación de ma- 
trices funciona aquí. Si la información dada se organiza en una matriz demanda D y una 
matriz precio P, se tiene 
0.10 0.15 
6 3 10 
= | | P = | 0.40 0.30 
4 8 5] Y 
0.10 0.20 
Los cálculos anteriores son equivalentes a calcular el producto 
Tabla 3.3 0.10 0.15 
[6 3 10 _ [2.80 3.80 
Sams Theos PS lag 50% E [10 400 
0.10 0.20 
Ann $2.80 $3.80 
Bert $4.10 $4.00 Por tanto, la matriz producto DP dice cuánto costarán las compras de cada persona en 


cada tienda (tabla 3.3). 


-l 
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Ejemplo 3.8 Considere el sistema lineal 

x — 2x, +t 3x% = 5 
1 (1) 
2x1 — x% +t 4% = 14 


= T o T -w 


Observe que el lado izquierdo surge del producto matricial 


1. =2 3 ||% 
-1 3 ıl% 
2 -1 4]lx 


de modo que el sistema (1) puede escribirse como 


1. =2 3||x 5 
-1 3 1lx|= 
2 =1 4]Lx, 14 


o Ax = b, donde A es la matriz de coeficientes, x es el vector (columna) de variables y b 
es el vector (columna) de términos constantes. 


El lector no debe tener dificultades para ver que todo sistema lineal puede escribirse 
en la forma Ax = b. De hecho, la notación [A | b] para la matriz aumentada de un sis- 
tema lineal sólo es una abreviatura para la ecuación matricial Ax = b. Esta forma pro- 
bará ser tremendamente útil para expresar un sistema de ecuaciones lineales y se le ex- 
plotará con frecuencia a partir de ahora. 

Al combinar esta intuición con el Teorema 2.4, se ve que Ax = b tiene una solución 
si y sólo si b es una combinación lineal de las columnas de A. 

Hay otro factor acerca de las operaciones matriciales que también resultará ser 
bastante útil: la multiplicación de una matriz por un vector unitario estándar puede 
usarse para “obtener” o “reproducir” una columna o un renglón de una matriz. Sea 


4 2 1 ; OOP 
A= E E '] y considere los productos Ae, y e,A, con los vectores unitarios e, y e, 


elegidos de modo que los productos tengan sentido. Por tanto 


A E 
=[0 5 -1] 


Note que Ae, produce la tercera columna de A y e,A produce el segundo renglón de A. 
El resultado general se registra como teorema. 


Teorema 3.1 Sea A una matriz n X m, e, un vector unitario estándar 1 X m y e, un vector unitario 


n X l estándar. Entonces 


a. ejes el ¡-ésimo renglón de A y 
b. Ae;es la ¡-ésima columna de A. 
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Demostración Se demuestra (b) y la demostración de (a) se deja como ejercicio 41. Si 
a...» a, son las columnas de A, entonces el producto Ae; puede escribirse 


Ae; = 0a, + 0a, + ++: + la; +++ + 0a, = a; 


También podría demostrar (b) mediante cálculo directo: 


0 
41 Aij Ain ||. aij 
4,1 ... lz; mre M . lz; 
A= |. K "Hals? 
Amı Amj Amn, 0 Amj 


pues el 1 en e; es la ¡-ésima entrada. 


Con frecuencia será conveniente considerar que una matriz está compuesta de algunas 
submatrices más pequeñas. Al introducir rectas verticales y horizontales en una matriz, 
se le puede partir en bloques. Hay una forma natural de partir muchas matrices, en par- 
ticular aquellas que surgen en ciertas aplicaciones. Por ejemplo, considere la matriz 


100 2 =l 
0O 1 0 1 3 
A=|0 0 1 4 0 
0 0 0 1 7 
0007 2 
Parece natural partir A como 
1 0 072 -1 
0101 3 
0.0114 0|= | i p| 
0 0 0il 7 di 
0.0.0.7 2 


donde I es la matriz identidad de 3 X 3, B es de 3 X 2, O es la matriz cero de 2 X 3 y C 
es de 2 X 2. De esta forma, puede ver a A como una matriz de 2 X 2 cuyas entradas son 
ellas mismas matrices. 

Cuando se multiplican matrices, con frecuencia se gana una ventaja al verlas como 
matrices particionadas. Esto frecuentemente no sólo revela las estructuras subyacentes, 
sino que usualmente acelera los cálculos, en especial cuando las matrices son grandes y 
tienen muchos bloques de ceros. Es evidente que la multiplicación de matrices particio- 
nadas es igual que la multiplicación ordinaria de matrices. 

Comience por considerar algunos casos especiales de matrices particionadas. Cada 
una da origen a una forma diferente de ver el producto de dos matrices. 

Suponga que A es de m X n y B es de n X r, de modo que existe el producto AB. Si 


AB = A[|b;: b): ©: :b,] = [Ab; : Ab, : ++- : Ab,] 
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Este resultado es una consecuencia inmediata de la definición de multiplicación de ma- 
trices. La forma a la derecha se llama representación matriz-columna del producto. 


> 
Ejemplo 3.9 | si 
4 — 
ll 3 2 
Ia 
0 =1 1 
3 
entonces 
4 =] 
i a32 13 1 3 2 5 
A A A 
0 —1 1 3 2 0 —1 1 0 =2 


133 
23=2 


cial ordinaria.) | 


Comentario  Advierta que la representación matriz-columna de AB permite escribir 
cada columna de AB como una combinación lineal de las columnas de A con entradas de 
B como coeficientes. Por ejemplo, 


PA AAA 


(Vea los ejercicios 23 y 26.) 


Por tanto, AB = [Ab, : Ab,] = | | (Compruebe mediante multiplicación matri- 


Suponga que A es de m X n y B es de n X r, de modo que existe el producto AB. Si 
particiona A en términos de sus vectores renglón como 


AL 
A 
A= a 
Ar AB 
A, A,B 
entonces ABS pe B [esp 
An Amb. 


Una vez más, este resultado es consecuencia directa de la definición de multiplicación 
matricial. La forma a la derecha se conoce como representación renglón-matriz del pro- 
ducto. 


> 


Ejemplo 3.10 


Con la representación renglón-matriz, calcule AB para las matrices del ejemplo 3.9. 
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Solución Calcule 


4 -l 4 -1 
AB=[1 3 2]|1 2|=[13 5] y A,B=[0 —1 1]|1 2 
3 3 
=[2 -2] 
A,B 13 5 
Por tanto, AB = |-------- = | eessiscanios , como antes 
A,B 2 =2 


al 


La definición del producto matricial AB usa la partición natural de A en renglones y 
B en columnas; esta forma bien puede llamarse representación renglón-columna del 
producto. También puede partir A en columnas y B en renglones; esta forma se llama re- 
presentación columna-renglón del producto. 

En este caso, se tiene 


Bi 
B 
A=laiaiia] y B=|-* 
B, 
B, 
de modo que AB = [aiai +": ¿a,]|-2 | = aB, + aB, + +: +a,B, (2) 


Note que la suma recuerda una expansión de producto punto; la diferencia es que los 
términos individuales son matrices, no escalares. Asegúrese de que esto tiene sentido. 
Cada término aB, es el producto de una matriz de m X 1 y una de 1 X r. Por tanto, cada 
aB; es una matriz de m X r del mismo tamaño que AB. Los productos a,B; se llaman pro- 
ductos exteriores y (2) se llama expansión de producto exterior de AB. 


Ejemplo 3.11 


Calcule la expansión de producto exterior de AB para las matrices del ejemplo 3.9. 


Solución Se tiene 


l; 3:2 Bı a 
A= [nimia] [y 35] y PB =[L. 2 
B, 3 0 
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(Observe que calcular cada producto exterior es exactamente igual que llenar una tabla 
de multiplicación.) Por tanto, la expansión de producto exterior de AB es 


4 -1 3 6 6 0 13 5 
aB, + aB, + asB, = 0 + + = = AB 


0 LL =2 3.0 2 -2 | 


La expansión de producto exterior se usará en los capítulos 5 y 7 cuando se estudie 
el Teorema Espectral y la descomposición de valor singular, respectivamente. 

Cada una de las particiones siguientes es un caso especial del particionamiento en 
general. Se dice que una matriz A está particionada si se introdujeron rectas horizonta- 
les y verticales que subdividen A en submatrices llamadas bloques. El particionamiento 
permite que A se escriba como matriz cuyas entradas son sus bloques. 

Por ejemplo, 


1.002 -1 á 311 21 
0 1.01 3 =i 212 1 
as [0.0 11% Ol y BS| 1 518 51 
0.0.0.1 7 To 9002 
0.0 07 2 o ia 04 


son matrices particionadas. Tienen las estructuras de bloque 
Aj A Bi Bp B 
A= | 11 e y B= | 11 12 >| 
Az Az Ba B» B 23 
Si dos matrices tienen el mismo tamaño y se parten la misma forma, es claro que pueden 
sumarse y multiplicarse por escalares bloque por bloque. Menos obvio es el hecho de 


que, con el particionamiento adecuado, las matrices también pueden multiplicarse en 
forma de bloque. El siguiente ejemplo ilustra este proceso. 


> 


Ejemplo 3.12 


Considere las matrices A y B anteriores. Si por el momento ignora el hecho de que sus 
entradas son matrices, entonces A parece ser una matriz de 2 X 2 y B una matriz de 2 X 3. 
En consecuencia, su producto debe ser una matriz de 2 X 3 dada por 


An a Bo E 
Az Az Ba B» B3 

o + AB Aj1Br ag AB, AB + Aj2B»3 
AB + AB» A21B1 us AB, A>1B;, + ArBa3 


.- 


Pero todos los productos de este cálculo en realidad son productos matriciales, así que 
debe asegurarse de que todos estén definidos. Una comprobación rápida revela que de 
hecho este es el caso, pues los números de columnas en los bloques de A (3 y 2) coinci- 
den con los números de renglones en los bloques de B. Se dice que las matrices A y B están 
particionadas de conformidad para multiplicación por bloques. 

Al realizar los cálculos indicados se obtiene el producto AB en forma particionada: 


4 3 2 =] 6 
A; Bı + AB = LBi +A =Bı +42 =| -1 2. |=+|1 3|=/0 
I ==3 4 3. =) 
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(Cuando algunos bloques son matrices cero o matrices identidad, como es el caso aquí, 
dichos cálculos pueden realizarse muy rápidamente.) Los cálculos para los otros cinco 
bloques de AB son similares. Compruebe que el resultado es 


2 


(Observe que el bloque en la esquina superior izquierda es el resultado de los cálculos 
anteriores.) Compruebe que obtiene la misma respuesta al multiplicar A por B en la 


forma usual. 


Potencias de matrices 


Cuando A y B son dos matrices de n X n, su producto AB también será una matriz de 
n X n. Un caso especial ocurre cuando A = B. Tiene sentido definir A? = AA y, en gene- 
ral, definir A* como 


k factores 


si k es un entero positivo. Por ende, At = A y es conveniente definir A? = I. 

Antes de hacer demasiadas suposiciones, debe preguntarse en qué medida las poten- 
cias de matrices se comportan como potencias de números reales. Las siguientes propie- 
dades se deducen inmediatamente de las definiciones recién dadas y son los análogos 
matriciales de las correspondientes propiedades de las potencias de los números reales. 


Si A es una matriz cuadrada y r y s son enteros no negativos, entonces 


l; AA SAS 
F AN SA 


En la sección 3.3 se extenderá la definición y las propiedades para incluir potencias de 
enteros negativos. 


Ejemplo 3.13 


I l 
(a) SIA = $ T | entonces 


oo oau A Ps ‘a, AL aa 4 A 
A = = , Æ = AA = = 
1 1j|1 1 2 2 2 2/11 1 4 4 
y, en general, 
gal gal 
sel 


y al para todo n = 1 


El enunciado anterior puede probarse mediante inducción matemática, pues es una 
colección infinita de enunciados, uno para cada número natural n. (El Apéndice B ofrece 
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un breve repaso de inducción matemática.) El paso básico es probar que la fórmula se 
cumple para n = 1. En este caso, 


ro 5 2 Ppi a 
A = [ya 271| |2 all. a74 


como se requiere. 
La hipótesis de inducción es suponer que 


EL 9 9 
A = gl 21 


para algún entero k = 1. El paso de inducción es probar que la fórmula se cumple para 
n = k + 1. Con la definición de potencias de matrices y la hipótesis de inducción, se 
calcula 


ron Pol T ' 


[2&+D-1 (e+1)-1 
= | (+11 w 


Por tanto, la fórmula se cumple para toda n = 1 por el principio de inducción matemá- 
tica. 


=| 0 —1|0 =1 =| 0 
y | entonces P= | | | = | 0 |A continuas 


; 0 
(b) sia = | 1 0 A 


se encuentra 


[ep 


Por tanto, B’ = B, y la sucesión de potencias de B se repite en un ciclo de cuatro: 
Dobla abla oblo thi l 
1 opl o UL oplo ipli of 


La transpuesta de una matriz 


ma 


Hasta el momento, todas las operaciones matriciales definidas son análogas a las opera- 
ciones sobre números reales, aunque no siempre pueden comportarse en la misma 
forma. La siguiente operación no tiene tal análogo. 


Sección 3.1 Operaciones con matrices 157 


Definición La transpuesta de una matriz A de m X n es la matriz A” de n X m 
que se obtiene al intercambiar las renglones y columnas de A. Esto es: la i-ésima co- 
lumna de A? es el i-ésimo renglón de A para toda i. 


nm 


ea 


Ejemplo 3.14 
b 
a=: o | p=|* Al y C=[5 -1 2] 


Entonces sus transpuestas son 


1 5 
a Cc 

A"=|3 0], fe Al y Ci=|-1 

2 1 


En ocasiones, la transpuesta se usa para dar una definición alternativa del producto 
punto de dos vectores en términos de multiplicación de matrices. Si 


u vı 

u |12 
u= i y v= 

Un Va 


entonces 


vi 
E [u uz un] e 

Vn 
= uly 


Una definición alternativa útil de la transpuesta se da en forma de componentes: 


(A) =A; paratodaiyj 


En palabras: las entradas en el renglón iy la columna j de A” son iguales que las entradas 
en el renglón j y la columna i de A. 

La transpuesta también se usa para definir un tipo muy importante de matriz cua- 
drada: una matriz simétrica. 


Definición Una matriz cuadrada A es simétrica si A7 = A; esto es: si A es igual a 
su propia transpuesta. 


Ejemplo 3.15 | Sea 


158 Capítulo 3 Matrices 


$ PE EEIN 1. =1 
s.0 Entonces A es simétrica, pues A? = A; pero B no es simétrica, pues B” = : a FB. 
N 
OR 
‘N 
N 
‘N 
id el 

Figura 3.1 Una matriz simétrica tiene la propiedad de que es su propia “imagen especular” a 
Una matriz simétrica 


través de su diagonal principal. La figura 3.1 ilustra esta propiedad para una matriz de 


3 X 3. Las formas correspondientes representan entradas iguales; las entradas de la dia- 
gonal (las que están sobre la recta rayada) son arbitrarias. 

Una definición por componentes de una matriz simétrica también es útil. Es simple- 
mente la descripción algebraica de la propiedad de “reflexión”, 


Una matriz cuadrada A es simétrica si y sólo si A; = A; para todo i y j. 


Ejercicios 3.1 


Sean 
3 0 4 —2 1 e 
a=] | -| | = E di 
=] 3 0 2 3 

556 

0 -3 =j 

TEE PaE TSE 

=2 1 2 


En los ejercicios 1-16, calcule las matrices indicadas (si es posi- 
ble). 


1.4 +2D 2.2D — 5A 
3.B-C 4. B — C 
5. AB 6. B? 
7.D + BC 8. B'B 
9. E(AF) 10. F(AF) 
11. FE 12. EF 
13. B'C" = (CB) 14. DA — AD 
15. A? 16. (1, — AY 


17. Proporcione un ejemplo de una matriz A de 2 X 2 dis- 
tinta de cero tal que A? = 0. 


2 1 
18. Sea A = 7 Al Encuentre matrices de 2 X 2 B y C 


tales que AB = AC, pero B + C. 


19. Una fábrica elabora tres productos (chismes, cachiva- 
ches y chunches) y los embarca a dos almacenes para su 
cuidado. El número de unidades de cada producto em- 
barcado a cada almacén está dado por la matriz 


200 75 
A=|150 100 
100 125 


(donde a; es el número de unidades de producto i envia- 
das al almacén j y los productos se guardan en orden alfa- 
bético). El costo de embarcar una unidad de cada pro- 
ducto por camión es $1.50 por chisme, $1.00 por 
cachivache y $2.00 por chunche. Los correspondientes 
costos unitarios para embarcar por tren son $1.75, $1.50 
y $1.00. Organice estos costos en una matriz B y luego use 
la multiplicación de matrices para mostrar cómo la fá- 
brica puede comparar el costo de embarcar sus productos 
a cada uno de los dos almacenes por camión y por tren. 


20. Con referencia al ejercicio 19, suponga que el costo uni- 
tario de distribuir los productos a tiendas es el mismo 
para cada producto, pero varía por almacén debido a las 
distancias involucradas. Cuesta $0.75 distribuir una uni- 
dad desde el almacén 1 y $1.00 distribuir una unidad 
desde el almacén 2. Organice dichos costos en una ma- 
triz C y luego use la multiplicación de matrices para 
calcular el costo total de distribuir cada producto. 


En los ejercicios 21-22, escriba el sistema dado de ecuaciones 
lineales como una ecuación matricial de la forma Ax = b. 
21. x% = 2% + 3% = 0 

2x1 + x, — 5%; = 4 


22: Xi + 2x, = 1 
g= = -2 
Ht y=] 


En los ejercicios 23-28, sean 


1 0 -2 

A=|-3 1 1 

2 0 -1 

2 30 

y B=| 1 -1 1 
-1 64 


23. Use la representación matriz-columna del producto 
para escribir cada columna de AB como una combina- 
ción lineal de las columnas de A. 


24. Use la representación renglón-matriz del producto para 
escribir cada renglón de AB como una combinación li- 
neal de los renglones de B. 


25. Calcule el desarrollo del producto exterior de AB. 


26. Use la representación matriz-columna del producto 
para escribir cada columna de BA como una combina- 
ción lineal de las columnas de B. 


27. Use la representación renglón-matriz del producto para 
escribir cada renglón de BA como una combinación li- 
neal de los renglones de A. 


28. Calcule el desarrollo del producto exterior de BA. 


En los ejercicios 29 y 30, suponga que el producto AB tiene 
sentido. 


29. Demuestre que, si las columnas de B son linealmente 
dependientes, entonces también lo son las columnas de 
AB. 


30. Demuestre que, si los renglones de A son linealmente 
dependientes, entonces también lo son los renglones de 
AB. 


En los ejercicios 31-34, calcule AB mediante multiplicación 
por bloques y use la partición indicada. 


j 2 3:0 
1 -1:0 0 ; 
' —1 1:0 
31.4A=|0 10.0 B=| += 
OEA. ON. 01 
0 0:12 3 
0:1 
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0 ¡1 0 
2 31.0 00 1 
32.A = y B=| or iih 
4 5:0 1 1:55 4 
23 2 
15 2 i 0 1 00 1 
3 4i o i O 1 1 0 
JIA S ie MES y Bi || e OA 
1. 05=1 1 0 0:50 —1 
013 1 -l 00i 0 
1 0 0:1 t2 34 1 
0 1 0;2 014i 1 
34, A = >, B= i 
0 0 1:3 0 0 1: 1 
0 0 0:;i4 L Ae a p 


0 1 
35. Sea A = | | 
=1. 1 


(a) Calcule 4?, A’, ..., A7. 
(b) ¿Qué es A”? ¿Por qué? 


1 1 
2 2 
36. Sea B = e eS . Encuentre y justifique B%””, 
vV  v2 


1 1 
37. Sea A = li i | Encuentre una fórmula para 


A” (n = 1) y verifique su fórmula usando inducción 


matemática. 
0 —senW 
38. Sea A = | A | 
sen 0 cosO 
D A a2 = | €S 20 —sen 20 
(a) Demuestre que senò zos30 |) 


(b) Demuestre, mediante inducción matemática, que 
cosnO —senn0 


n 


[para n= 


sen n0 cos nÚ0 


39. En cada uno de los siguientes, encuentre la matriz A = 
[a;] de 4 X 4 que satisfaga la condición dada: 


(a) a, ==)" (b) a, =j—i 
(c) a, = (¡— 1) (d) a, = sen ES 27) 


40. En cada uno de los siguientes, encuentre la matriz A = 
[a;] de 6 X 6 que satisfaga la condición dada: 


aach I is aal sili=¿<1 
j 0 sii>j NO sili—¿ > 1 


(0) l si6=1+,3<8 
A; — 
Y (0 de otro modo 


41. Demuestre el Teorema 3.1 (a). 
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Álgebra matricial 


En ciertos aspectos, la aritmética de matrices generaliza la de los vectores. No se esperan 
sorpresas con respecto a la suma y la multiplicación por un escalar, y de hecho no las hay. 
Esto permitirá extender a las matrices varios conceptos que ya son familiares a partir del 
trabajo con vectores. En particular, combinaciones lineales, conjuntos generadores e in- 
dependencia lineal se trasladan a las matrices sin dificultad. 

Sin embargo, las matrices tienen otras operaciones, como la multiplicación matricial, 
que no poseen los vectores. No debe esperar que la multiplicación matricial se comporte 
como la multiplicación de números reales, a menos que pueda probar que lo hace; de 
hecho, no lo hace. En esta sección se resumen y demuestran algunas de las propiedades 
principales de las operaciones matriciales y se comienza por desarrollar un álgebra de ma- 
trices. 


Propiedades de la suma y la multiplicación por un escalar 


Todas las propiedades algebraicas de la suma y la multiplicación por un escalar para vec- 
tores (Teorema 1.1) se trasladan a las matrices. En el siguiente teorema se resumen di- 
chas propiedades. 


Teorema 3.2 


Propiedades algebraicas de la suma y la multiplicación escalar matriciales 
Sean A, B y C matrices del mismo tamaño, y sean c y d escalares. Entonces 


a A+B=B+A Conmutatividad 
b. (A+B)+FC=A+(B+C) Asociatividad 

c AFO=A 

d. A+ (-4)=0 

e. c(A + B) = cA + cB Distributividad 
f. (c+ d)A = cA + dA Distributividad 
g. c(dA) = (cd)A 

h. 14=A 


Las demostraciones de dichas propiedades son análogos directos de las correspon- 
dientes pruebas de las propiedades vectoriales y se dejan como ejercicios. Del mismo 
modo, los comentarios que siguen al Teorema 1.1 son igualmente válidos aquí y usted no 
debe tener dificultad para usar dichas propiedades en la realización de manipulaciones al- 
gebraicas con matrices. (Revise el ejemplo 1.5 y vea los ejercicios 17 y 18 al final de esta 
sección.) 

La propiedad de asociatividad permite sin ambigiiedades combinar la multiplicación 
por un escalar y la suma sin paréntesis. Si A, B y C son matrices del mismo tamaño, en- 
tonces 


(2A + 3B) — C = 2A + (3B — C) 


y por tanto simplemente puede escribirse 2A + 3B — C. En general, entonces, si A,, 
A» ..., A¿ son matrices del mismo tamaño y C,, C,, ...., C son escalares, puede formarse 
la combinación lineal 


CA, t oA; +: +A, 


A Cp ©... C se les denomina como los coeficientes de la combinación lineal. Ahora 
puede plantear y responder preguntas acerca de las combinaciones lineales de matrices. 
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Ejemplo 3.16 ni T E 
Sean A; = , A) = y Az = i 
=I 0 0 1 l1 1 


1 4 
(a) ¿B = h l es una combinación lineal de A4, A, y Az? 


2 
| es una combinación lineal de A,, A, y A}? 
4 


1 
(b) ¿C = b 


Solución 
(a) Se quieren encontrar escalares c}, C, y C, tales que cA; + c,A, + cA, = B. Por tanto, 


0 |+ o |+ k | E l 
C: == 
ta al loa] Sh Y 2 1 


El lado izquierdo de esta ecuación puede reescribirse como 


Eor i 
-tG QtG 


Al comparar entradas y usar la definición de igualdad matricial, se tienen cuatro ecua- 
ciones lineales 


c+ag=]1 
Ci +(=4 
=(i +a=2 
G te= l 


La eliminación de Gauss-Jordan produce fácilmente 


0 1 1/1 1 0 1 
1.0 1/4 0 1 =2 
=i 0 1/2 0 0 1| 3 
0 1 1|1 0 0 01 0 
»—>  (¡compruébelo!), de modo que c, = 1, c, = —2, y c, = 3. En consecuencia, A, — 2A, + 


3A, = B, que puede comprobarse fácilmente. 
(b) Esta vez se quiere resolver 


0 E f |+ E del A 
al- of loal Sh aj le 4 


Al proceder como en el inciso (a), se obtiene el sistema lineal 


c+c=1l 
Ci + (3=2 
=0 +06=3 


c+C0=4 
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La reducción por renglones produce 


o 1 ıļı 0 1 1ji 
RRi 
¡qa A] 1012 
-1 0 113 -1 0 113 
0 1 1ıļ4 0.0013 


No es necesario avanzar más: el último renglón implica que no hay solución. Por tanto, 
en este caso, C no es una combinación lineal de A}, A, y As. 


Comentario Observe que las columnas de la matriz aumentada contienen las entra- 
das de las matrices que se proporcionan. Si se leen las entradas de cada matriz de iz- 
quierda a derecha y de arriba abajo, se obtiene el orden en el que aparecen en las colum- 
nas de la matriz aumentada. Por ejemplo, A, se lee como “0,1,—1,0” que corresponde a 
la primera columna de la matriz aumentada. Es como si simplemente se “estiraran” las 
matrices dadas en vectores columna. Por tanto, habría terminado exactamente con el 
mismo sistema de ecuaciones lineales que en el inciso (a) si se hubiera preguntado: 


0 


: : . 1 
una combinación lineal de ; 


Es 


=. N AÀA e 
= oOo oOo = 


1 
y| ik 
; ME 
0 1 


A partir de ahora se encontrarán con frecuencia tales paralelismos. En el capítulo 6 se les 
explorará con más detalle. 


Se puede definir el espacio generado por un conjunto de matrices como el conjunto 
de todas las combinaciones lineales de las matrices. 


Ejemplo 3.17 


Describa el espacio generado por las matrices A}, A, y A; en el ejemplo 3.16. 


Solución Una forma de hacer esto es simplemente escribir una combinación lineal ge- 


neral de A, A, y Az. Por tanto, 
0 1 1 0 1 1 
alas ol todo altali a 
=1 0 0 1 1 1 


[dió GtG 
=) tG GPG 


ĉ&iAi + GA; + GA; 


(que es análogo a la representación paramétrica de un plano). Pero suponga que se 


xX 


a P so W a : 
quiere saber cuándo la matriz | | está en gen(A,, A,, Ay). A partir de la representa- 


Z 


ción anterior, se sabe que lo está cuando 
O +G a j 
—C tG G +G y z 
para alguna elección de escalares C,, C,, C3. Esto da origen a un sistema de ecuaciones li- 


neales cuyo lado izquierdo es exactamente igual que el del ejemplo 3.16, pero cuyo lado 
derecho es general. La matriz aumentada de este sistema es 
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0 1 1|w 
1.0 1|[x 
=i 0 Ty 
0 1 1l|z 
y la reducción por renglones produce 
0 1 1|w 1 0 0 lx — 3y 
1.0 1[x|_,|0 1 0|-3x—3y+w 
-1 0 ijy 0 0 1 lx + iy 
0 1 1|z 0.00 wz 


(Compruebe esto cuidadosamente.) La única restricción proviene del último renglón, 
donde claramente se debe tener w — z = 0 para tener una solución. Por tanto, el gen 


x 
| para las cuales w = z. Esto es 


s 


Nota Sise hubiese sabido esto antes de intentar el ejemplo 3.16, habría visto inme- 


; f w 
de A,, A, y A, consiste de todas las matrices | 


y 
es: gen(A,, A), As) a ah 
yw 


1 
diatamente que B = lA E una combinación lineal de A}, A, y Aj, pues tiene la 
; 1 2 
forma necesaria (tome w = 1,x = 4 y y = 2), pero C = 34 no puede ser una com- 
binación lineal de A, A, y Az, ya que no tiene la forma adecuada (1 #4). 
La independencia lineal también tiene sentido para matrices. Se dice que las matri- 


ces A,, A» . . ., A, del mismo tamaño son linealmente independientes si la única solu- 
ción de la ecuación 


Ejemplo 3.18 


cA; + GA, + oo + GA; = O (1) 
es la trivial: c, = c, = *** = c = 0. Si no hay coeficientes triviales que satisfagan (1), en- 
tonces A,, A, . . ., A, se llama linealmente dependiente. 

> 


Determine si las matrices A}, A, y A; en el ejemplo 3.16 son linealmente independien- 
tes. 


Solución Se quiere resolver la ecuación c,A, + cA, + cA, = O. Al escribir las matri- 


ces, se tiene 
0 1 1.0 1 1 0 0 
c TO + G = 
-=1 0 0 1 1 1 0 0 


Esta vez se tiene un sistema lineal homogéneo cuyo lado izquierdo es el mismo que en los 
ejemplos 3.16 y 3.17. (¿Comienza a vislumbrar un patrón?) La matriz aumentada se re- 
duce por renglones para obtener 


0 1 1/0 1 0 0/0 
1.0 10 0 1 0/0 
=1 0 1/0 0.0 1/0 
0 1 1/0 0 0 0/0 
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Por tanto, c, = c, = c = 0, y se concluye que las matrices A,, A, y A; son linealmente in- 


dependientes. 


Propiedades de la multiplicación matricial 


Siempre que encuentre una nueva operación, como la multiplicación matricial, debe 
tener cuidado de no suponer demasiado acerca de ella. Sería bueno si la multiplicación 
matricial se comportara como la multiplicación de números reales. Aunque en muchos 
aspectos lo hace, existen algunas diferencias significativas. 


Ejemplo 3.19 


Considere las matrices 


Al multiplicar se obtiene 


A A 


Por tanto, AB F BA. Así que, en contraste con la multiplicación de números reales, la 
multiplicación de matrices no es conmutativa: ¡el orden de los factores en un producto sí 
importa! 


j 0 0 
Es fácil comprobar que A* = [e o] (¡hágalo!). De este modo, para matrices, la 


ecuación A? = O no implica que A = O (a diferencia de la situación para números rea- 
les, donde la ecuación x? = 0 sólo tiene x = 0 como solución). 


Por muy tristes que parezcan las cosas después del último ejemplo, la situación real- 
mente no es tan mala: sólo necesita acostumbrarse a trabajar con matrices y recordar 
constantemente que no son números. El siguiente teorema resume las principales pro- 
piedades de la multiplicación de matrices. 


Teorema 3.3 


Propiedades de la multiplicación de matrices 


Sean A, B y C matrices (cuyos tamaños son tales que pueden realizarse las operacio- 
nes indicadas) y sea k un escalar. Entonces 


a. A(BC) = (AB)C Asociativa 

b. A(B + C) = AB + AC Distributiva izquierda 
c. (A + B)C = AC + BC Distributiva derecha 

d. k(AB) = (kA)B = A(kB) 

e. 1, A=A=AlL, siAesmXmn Identidad multiplicativa 


Demostración Se demuestran (b) y la mitad de (e). La demostración de la propiedad (a) 
se difiere hasta la sección 3.6. Las propiedades restantes se consideran en los ejercicios. 
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(b) Para demostrar A(B + C) = AB + AG, los renglones de A se denotan como A, y las 
columnas de B y C como b;y e; Entonces la columna j-ésima de B + Ces b; + c; (ya que 
la suma está definida por componentes) y por tanto 
[A(B + C)]j = Ag (b; + c) 
= A; bj + A/=c; 
= (AB); + (AC); 


Dado que esto es cierto para todo iy j, se debe tener A(B + C) = AB + AC. 
(e) Para demostrar AI, = A, note que la matriz identidad 1, puede partirse en columnas 


como 
1, = [e,te,i "> +e,] 


donde e, es un vector unitario estándar. Por tanto, 


por el Teorema 3.1(b). 3 


Puede usar estas propiedades para explorar aún más cuán estrechamente la multipli- 
cación de matrices recuerda la multiplicación de números reales. 


Ejemplo 3.20 


Si A y B son matrices cuadradas del mismo tamaño, ¿(A + B} = A? + 2AB + B”? 


Solución Con las propiedades de la multiplicación de matrices, se calcula 
(A+ BÝ = (A + B)(A + B) 
= (A + B)A + (A + B)B por distributividad izquierda 
= A? + BA + AB + P por distributividad derecha 
Por tanto, (A + B)? = A? + 2AB + P’ si y sólo si A? + BA + AB + B? = A? + 2AB + P’. 
Al restar A? y B? de ambos lados se obtiene BA + AB = 2AB. Al restar AB de ambos lados 


se obtiene BA = AB. Por tanto, (A + B)? = A? + 2AB + Bl si y sólo si A y B se conmu- 
tan. (¿Puede dar un ejemplo de tal par de matrices? ¿Puede encontrar dos matrices que 


no satisfagan esta propiedad?) 


Propiedades de la transpuesta 


Teorema 3.4 


Propiedades de la transpuesta 


Sean A y B matrices (cuyos tamaños son tales que pueden realizarse las operaciones 
indicadas) y sea k un escalar. Entonces 


a (AA b. (A + B)! = AT + BT 
c. (kA) = kaS d. (AB) = BIAT 
e. (41) = (47)" para todos los enteros r no negativos 
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Demostración Las propiedades (a)-(c) son intuitivamente claras y directas de demos- 
trar (vea el ejercicio 30). Demostrar la propiedad (e) es un buen ejercicio de inducción 
matemática (vea el ejercicio 31). Se demostrará (d), pues no es lo que se hubiera espe- 
rado. [¿Usted sospecharía que (AB)? = AB" puede ser verdadero?] 

Primero, si A es de m X n y Bes de n X r, entonces B'esderXn yA! es den X m. 
Por tanto, el producto BA? está definido y es de r X m. Dado que AB es de m X r, (AB)? 
es de r X m, y por tanto (AB)” y BA” tienen el mismo tamaño. Ahora debe demostrar 
que sus correspondientes entradas son iguales. 

Denote el ¡-ésimo renglón de una matriz X mediante renglón¡(X) y su j-ésima co- 
lumna mediante col¡(X). Al usar estas convenciones, se ve que 


[(4B)"]; E (AB); 
= renglón (A) - col(B) 
col (A") + renglón(B”) 
= renglón (B") - col(A") = [B"A"]; 


(Note que se usó la definición de multiplicación de matrices, la definición de la trans- 
puesta y el hecho de que el producto punto es conmutativo.) Dado que 1 y j son arbitra- 
rios, este resultado implica que (AB)? = BA”. 
— 
Comentario Las propiedades (b) y (d) del Teorema 3.4 pueden generalizarse a 
sumas y productos de un número finito de matrices: 


(AtA te HAD SA HAHHA y 
= AT ar AT AT 
si supone que los tamaños de las matrices son tales que todas las operaciones pueden 


realizarse. En los ejercicios 32 y 33 se le pide demostrar estos hechos mediante inducción 
matemática. 


(A/A, a Ar)" 


Ejemplo 3.21 


Sean 


1 2 4 -1 0 
sjal a P a 
3 4 2 3-1 


1 3 2 5 
Entonces A” = o A de modo que A + A" = f i una matriz simétrica. 


Se tiene 


de modo que 


0 
4 2 20 2 2 
R 4 -1 0 
y BB=]|-1 3 =| 2 10 3 
2 31 
0 1 2 31 


En consecuencia, tanto BB como B"B son simétricas, ¡aun cuando B ni siquiera es cua- 
drada! (Compruebe que AA” y AA también son simétricas.) | 


Sección 3.2 Álgebra matricial 161 


El siguiente teorema dice que los resultados del ejemplo 3.21 son verdaderos en ge- 


neral. 


Teorema 3.5 


a. Si A es una matriz cuadrada, entonces A + AT es una matriz simétrica. 
b. Para cualquier matriz A, AA? y ATA son matrices simétricas. 


Demostración Se demuestra (a) y se deja la demostración de (b) como ejercicio 34. 
Simplemente demuestre que 


(A+ ADT =A + (AD = AT A=A+ A? 


(con las propiedades de la transpuesta y la conmutatividad de la suma de matrices). Por 
tanto, A + A? es igual a su propia transpuesta y en consecuencia, por definición, es si- 


métrica. 


Í Ejercicios 3.2 


—— 


Y 


En los ejercicios 1-4, resuelva la ecuación para X, dado que 


pe 9 


1.X-24A+3B=0 
2.3X=A-— 2B 

3. 2(A + 2B) = 3X 

4. 2(A — B + 2X) = 3(X — B) 


En los ejercicios 5-8, escriba B como una combinación lineal de 
las otras matrices, si es posible. 


2 5 1 2 0 1 
MET | | A ~ | | A y | | 
0 3 =]. 1 2 1 


TE 2 l k=l 1 a 
0.1.0 0.0.0 
6 -2 5 10 0 
8.B=|-2 8 6|, A=ļo 1 0j, 
5 6 6 0 0 1 
1 11l 1 0 1 
A&=|1 0 1|, 4=ļ]0 1 0f, 
1 11l 1 0 1 


0 —1 0 
Aj=|-1 1 1 
0. 1.0 


En los ejercicios 9-12, encuentre la forma general del generador 
de las matrices indicadas, como en el ejemplo 3.17. 


9. gen(A,, A) en el ejercicio 5 
10. gen(A,, A), As) en el ejercicio 6 
11. gen(A,, A, Ay) en el ejercicio 7 
12. gen(A,, A), Az, A4) en el ejercicio 8 


En los ejercicios 13-16, determine si las matrices dadas son li- 
nealmente independientes 


«316903 
3 4 7 8 l1 1 
0 1 1 0 2 1 l 
s diz Í 3; 0 1 |, 1 
-=1 0 1 1 0 2 4 
L =l 2 2- 1 -3 1 2 1 
16. f 2 6|,|0 4 9]|,|0 3 > |, 
0 0 1 0 0 5 0 =] 
=1 1 =1 
| 0.00 —4 
0 0 0 


168 Capítulo 3 Matrices 


17. Demuestre el Teorema 3.2(a)-(d). 
18. Demuestre el Teorema 3.2(e)-(h). 
19. Demuestre el Teorema 3.3(c). 
20. Demuestre el Teorema 3.3(d). 


21. Demuestre la mitad del Teorema 3.3(e) que no se de- 
mostró en el texto. 


22. Demuestre que, para matrices cuadradas A y B, AB = 
BA si y sólo si (A — BJ(A + B) = A? — P’. 


a b 
En los ejercicios 23-25, si B = | el , encuentre las condicio- 
c 


nes de a, b, c y d para las que AB = BA. 


15 AL I = 1 2 
nafi Jaro asa 3] 
0 1 =1 1 3 4 


26. Encuentre las condiciones de a, b, c y d para los que 


B= conmuta tanto con como 
cd 0 0 


con ; 
0 1 


27. Encuentre las condiciones sobre a, b, c y d tales que 


a b 
B= | conmuta con toda matriz de 2 X 2. 
Č 


28. Demuestre que, si AB y BA están ambas definidas, en- 
tonces AB y BA son ambas matrices cuadradas. 


Una matriz cuadrada se llama triangular superior si todas las 
entradas abajo de la diagonal principal son cero. Por tanto, la 
forma de una matriz triangular superior es 


0 * t x 
0 0 

T t x 
0 0 0 * 


donde las entradas marcadas + son arbitrarias. Una definición 

más formal de tal matriz A = [a;] es quea; = Osii > j. 

29. Demuestre que el producto de dos matrices triangulares 
superiores n X n es triangular superior. 

30. Demuestre el Teorema 3.4(a)-(c). 

31. Demuestre el Teorema 3.4(e). 

32. Mediante inducción, demuestre que para toda n = 1, 
(A HA, + o o RA) SATAA HA. 

33. Mediante inducción, demuestre que, para todo n = 1, 
(A, A, 0: A) = AF e AZAL. 

34. Demuestre el Teorema 3.5(b). 


35. (a) Demuestre que si A y B son matrices simétricas de 

n X n, entonces también lo es A + B. 

(b) Demuestre que si A es una matriz simétrica de 
n X n , entonces también lo es kA para cualquier es- 
calar k. 

36. (a) Proporcione un ejemplo para demostrar que si A y 
B son matrices simétricas de n X n , entonces AB no 
necesita ser simétrica. 

(b) Demuestre que, si A y B son matrices simétricas de 
n X n , entonces AB es simétrica si y sólo si AB = 
BA. 


Una matriz cuadrada se llama antisimétrica si A” = —A. 


37. ¿Cuáles de las siguientes matrices son antisimétricas? 


1 2 0 -1 
wf] wf 

0 3 -1 0 1 2 
(c) |-3 0o 2| (d|-1 0 5 

1-2 0 2 5 0 


38. Proporcione una definición en componentes de una 
matriz antisimétrica. 


39. Demuestre que la diagonal principal de una matriz anti- 

simétrica debe consistir completamente de ceros. 

40. Demuestre que, si A y B son matrices de n X n antisi- 

métricas, entonces también lo es A + B. 

41. Si A y B son matrices de n X n antisimétricas, ¿en qué 

condiciones AB es antisimétrica? 

42. Demuestre que, si A es una matriz de n X n, entonces 

A -— A" es antisimétrica. 

43. (a) Demuestre que cualquier matriz cuadrada A puede 
escribirse como la suma de una matriz simétrica y 
una matriz antisimétrica. [Sugerencia: considere el 
Teorema 3.5 y el ejercicio 42. ] 

(b) Ejemplifique el inciso (a) con la matriz 


1 2 3 
A=|4 5 6l. 
7 8 9 


La traza de una matriz A = [a] den X n es la suma de las en- 
tradas en su diagonal principal y se denota mediante tr(A). 
Esto es, 


tr(A) =a y + a+ co +a 


nn 


44. Si A y B son matrices de n X n, demuestre las siguientes 
propiedades de la traza: 


(a) tr(A + B) = tr (A) + tr (B) 
(b) tr (kA) = ktr (A), donde k es un escalar 

45. Demuestre que si A y B son matrices de n X n, entonces 
tr(AB) = tr (BA). 

46. Si A es cualquier matriz, ¿a qué es igual tr(A4?)? 


47. Demuestre que no hay matrices de A y B de 2 X 2 tales 
que AB — BA = L. 


| 


' 
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En esta sección se regresa a la descripción matricial Ax = b de un sistema de ecuaciones 
lineales y se buscan formas de usar el álgebra matricial para resolver el sistema. Por ana- 
logía, considere la ecuación ax = b, donde a, b y x representan números reales y se quiere 
resolver para x. Rápidamente puede suponer que se quiere x = b/a como la solución, 
pero debe recordar que es cierto sólo si a #0. Al proceder con más lentitud y suponer que 
a #0, se llegará a la solución mediante la siguiente secuencia de pasos: 


1 1 1 b b 
a= osia) =L0)3 (Ho Je 2 101121 


a a 
(¡Este ejemplo muestra cuánto se hace en la cabeza y cuántas propiedades de aritmética 
y álgebra se dan por sentadas!) 

Para imitar este procedimiento para la ecuación matricial Ax = b, ¿qué se necesita? 
Se necesita encontrar una matriz A” (análoga a 1/a) tal que A'A = I, una matriz identi- 
dad (análoga a 1). Sí tal matriz existe (análoga al requisito de que a + 0), entonces puede 
hacer la siguiente secuencia de cálculos: 


Ax = b > A' (Ax) = A'b > (A'A)x = A'b => Ix = A'b=>x = A'b 


(¿Por qué se justificaría cada uno de estos pasos?) 

La meta en esta sección es determinar precisamente cuándo es posible encontrar tal 
matriz A”. De hecho, se insistirá un poco más: se quiere no sólo A'A = I, sino también 
AA' = I. Este requisito fuerza a A y A” a ser matrices cuadradas. (¿Por qué?) 


Definición Si A es una matriz de n X n, una inversa de A es una matriz A’ de 
n X n con la siguiente propiedad 


MEE y AMÓN 


donde I = [,, es la matriz identidad. Si tal A” existe, entonces A es invertible. 


a = 


2 5 3 =5 
Si A = É N entonces A' = E 5] es una inversa de A, pues 


IA OA 


Ejemplo 3.23 


> 
Demuestre que las siguientes matrices no son invertibles: 
0 0 1 2 
a) O= b) B= 
@wo=|o o] A 
Solución 


(a) Es fácil ver que la matriz O no tiene una inversa. Si lo tuviera, entonces sería una ma- 
triz O” tal que OO' = I = O'O. Pero el producto de la matriz cero con cualquiera otra 
matriz es la matriz cero y por tanto OO” nunca podría ser igual a la matriz identidad I. 
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(Note que esta prueba no hace alusión al tamaño de las matrices y por tanto es verdadera 
para matrices de n X n en general.) 


w 
y 


EEIE 


de donde se obtienen las ecuaciones 


x 
(b) Suponga que B no tiene inversa B’ = | | La ecuación BB' = I produce 
z 


w + 2y zj 
pS + 2z=0 
2w + 4y =0 
2x + 4z=1 
Al restar dos veces la primera ecuación de la tercera produce 0 = —2, que claramente es 


un absurdo. Por tanto, no hay solución. (La reducción por renglones produce el mismo 
resultado pero en realidad no es necesaria aquí.) Se deduce que no existe tal matriz B’; 
esto es: B no es invertible. (De hecho, incluso no tiene una inversa que funcione en un 


lado, ¡mucho menos en dos!) 
Comentarios 


+ Aun cuando se vio que la multiplicación de matrices, en general, no es conmuta- 
tiva, A” (si existe) debe satisfacer A'A = AA”. 
Los ejemplos anteriores plantean dos preguntas que se responderán en esta sec- 
ción: 
(1) ¿Cómo puede saberse cuándo una matriz tiene inversa? 
(2) Si una matriz tiene inversa, ¿cómo puede encontrarla? 


+ No se reglamentó la posibilidad de que una matriz A pueda tener más de una in- 
versa. El siguiente teorema garantiza que esto no puede suceder. 


Teorema 3.6  SiA es una matriz invertible, entonces su inversa es única. 


Demostración En matemáticas, una forma estándar de demostrar que sólo hay uno de 
algo es demostrar que no puede haber más de uno. De este modo, suponga que A tiene 
dos inversas, por ejemplo, A’ y A”. Entonces 


AA =I=A'A_ y AA" =]I=A"A 
Por tanto, A' = A'I = A'(AA") = (A'A)A" = IA" = A" 
En consecuencia, A’ = A”, y la inversa es única. — 
Gracias a este teorema, ahora puede referirse a la inversa de una matriz invertible. A 


partir de ahora, cuando A sea invertible, su inversa (única) se denotará mediante A?! 
(pronúnciese “A inversa”). 


n i -a_l ; ; PN 
Advertencia ¡No escriba A™! = ru No existe una operación tal como la “división 


entre una matriz”. Incluso si la hubiera, ¿cómo se podría dividir el escalar 1 entre la ma- 
triz A? Si alguna vez se siente tentado a “dividir” entre una matriz, lo que realmente 
quiere hacer es multiplicar por su inversa. 
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Ahora puede completar la analogía que se estableció al comienzo de esta sección. 


Teorema 3.7 


Si A es una matriz invertible de n X n , entonces el sistema de ecuaciones lineales 
dado por Ax = b tiene la solución única x = A`™'b para cualquier b en R”. 


Demostración El Teorema 3.7 en esencia formaliza el comentario hecho al comienzo de 
esta sección. Se revisará nuevamente, ahora con un poco más de cuidado. Se pidió pro- 
bar dos cosas: que Ax = b tiene una solución y que tiene una sola solución. (En mate- 
máticas, tal demostración se conoce como demostración de “existencia y unicidad”) 

Para demostrar que existe una solución, sólo necesita verificar que funciona x = 
A` *b. Se comprueba que 


A(A7'b) = (AA7I)b = Ib = b 


De modo que A” 'b satisface la ecuación Ax = b y por tanto existe al menos esta solución. 

Para demostrar que esta solución es única, suponga que y es otra solución. Entonces 
Ay = b, y al multiplicar ambos lados de la ecuación por A”? a la izquierda, se obtiene la 
cadena de implicaciones 


A (Ay) =A b=>(4 Ay = A'b > Iy = A'b =y = A™'b 


Por tanto, y es la misma solución que antes, y en consecuencia la solución es única. 
— A 
De este modo, al regresar a las preguntas planteadas en los comentarios previos al Teo- 
rema 3.6, ¿cómo podría decir si una matriz es invertible y cómo puede encontrar su inversa 
cuando es invertible? Dentro de poco se dará un procedimiento general, pero la situación 
para las de matrices de 2 X 2 es suficientemente simple para garantizar que es singular. 


Teorema 3.8 


b 
Si A = 1 A entonces A es invertible si ad — bc #0, en cuyo caso 
G 


E E A 
ad == lle a 


Si ad — bc = 0, entonces A no es invertible. 


La expresión ad — bc se llama determinante de A y se denota det A. Por tanto, la 


1 
fórmula para la inversa de Bl A (cuando existe) es detA multiplicado por la matriz 
e 


c 
obtenida al intercambiar las entradas en la diagonal principal y cambiar los signos en las 


otras dos entradas. Además de dar esta fórmula, el Teorema 3.8 dice que una matriz A de 
2 X 2 es invertible si y sólo si det A # 0. En el capítulo 4 se verá que el determinante 
puede definirse para todas las matrices cuadradas y que este resultado sigue siendo 
cierto, aunque no hay una fórmula simple para la inversa de matrices cuadradas más 
grandes. 


Demostración Suponga que det A = ad — bc #0. Entonces 


hi all d Bel Pei do Fa 0 acta a 
c dil-<c a cd — dc —cb + da 0 ad — bc i 0 1 
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De igual modo, 
d -b 1 0 
e ae a A a 
=c  alic d 0 1 
Dado que det A #0, puede multiplicar ambos lados de cada ecuación por 1/det A para 
obtener 
i alaale al) lo a 
c diidetA|=c a 0 1 
Gae ale aldo 
j detAl=c a é d 0 1 
[Note que se usó la propiedad (d) del Teorema 3.3.] Por tanto, la matriz 
1 | d > 
detAl=c a 
satisface la definición de una inversa, de modo que A es invertible. Puesto que la inversa 
de A es única, por el Teorema 3.6, debe tener 


ie | d > 
detAl=c a 
Por el contrario, suponga que ad — bc = 0. Se considerarán por separado los casos 
donde a #0 y donde a = 0. Si aF0, entonces d = bc/a, de modo que la matriz puede es- 


CI ibirse como 
Ç d ac/a bc/a ka kb 


donde k = c/a. En otras palabras, el segundo renglón de A es un múltiplo del primero. Al 


A a . w x 
referirse al ejemplo 3.23(b), se ve que si A tiene una inversa | | entonces 
y z 


la aly llo 


y el sistema correspondiente de ecuaciones lineales 


aw + by =1 
ax + bz=0 
kaw + kby =0 
kax + kbz = 1 


no tiene solución. (¿Por qué?) 
Si a = 0, entonces ad — bc = 0 implica que bc = 0, y por tanto b o c es 0. En conse- 


cuencia, A es de la forma 
E ys 
c d 0 d 


En el pri l Ali i E Al + b i De igual modo [o ; no 
mer > = . > 
n el primer caso E aly z e i od gu $ q 


puede tener una inversa. (Verifique esto.) 
En consecuencia, si ad — bc = 0, entonces A no es invertible. | 
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Ejemplo 3.24 


ln -15 


, si existen. 
4 =5 


1 2 
Encuentre las inversas de A = ; | yB = 


Solución Se tiene det A = 1(4) — 2 (3) = —2 #0, de modo que A es invertible, con 
a If 4 -2 -2 1 
A Sa z 3 1 
-2| -3 ı 3 ol 
(Compruebe esto.) 


Por otra parte, B = 12(—5) — (- 15) (4) = 0, de modo que B no es invertible. 


Ejemplo 3.25 


Teorema 3.9 


> 


Use la inversa de la matriz de coeficientes para resolver el sistema lineal 
x+2y= 3 
3x + 4y = -2 


e i : 1 2 i 
Solución La matriz de coeficientes es la matriz A = pi A , cuya inversa se calculó en 
el ejemplo 3.24. Por el Teorema 3.7, Ax = b tiene la solución única x = A” 'b. Aquí se 


i 3 i i 
tiene b = | 3 | por tanto, la solución al sistema dado es 


Comentario Resolver un sistema lineal Ax = b mediante x = A” 'b parecería ser un 
buen método. Por desgracia, excepto para matrices de coeficientes de 2 X 2 y matrices 
con ciertas formas especiales, casi siempre es más rápido usar eliminación gaussiana o de 
Gauss-Jordan para encontrar directamente la solución. (Vea el ejercicio 13.) Más aún, la 
técnica del ejemplo 3.25 funciona sólo cuando la matriz de coeficientes es cuadrada e in- 
vertible, mientras que los métodos de eliminación siempre pueden aplicarse. 


Propiedades de las matrices invertibles 


El siguiente teorema registra algunas de las propiedades más importantes de las matrices 
invertibles. 


a. Si A es una matriz invertible, entonces A”! es invertible y 
(a 


b. Si A es una matriz invertible y c es un escalar distinto de cero, entonces cA es una 
matriz invertible y 


1 
(ca)? ==A7? 
c 
c. Si Ay B son matrices invertibles del mismo tamaño, entonces AB es invertible y 


(AB) = B AT. 
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d. Si A es una matriz invertible, entonces A” es invertible y 
Aa = LAOS 


e. Si A es una matriz invertible, entonces A” es invertible para todo entero n no nega- 
tivo y 


(A") = (Aa 


Demostración Se demostrarán las propiedades (a), (c) y (e), y las propiedades (b) y (d) 
se dejarán para su demostración en los ejercicios 14 y 15. 


(a) Para demostrar que A”? es invertible, debe argumentar que existe una matriz X tal 
que 


AIX=I=XA? 


Pero ciertamente A satisface estas ecuaciones en lugar de X, de modo que A”? es inverti- 
ble y A es una inversa de A~ '. Dado que las inversas son únicas, esto significa que (A~!) ~! 
=A. 


(c) Aquí debe demostrar que existe una matriz X tal que 
(AB)X = I = X(AB) 
La afirmación es que la sustitución de B7'A”* por X funciona. Se comprueba que 


(AB)\(B'A™') = ABBA? = AIA ' = AA ' =] 


donde se usó asociatividad para recorrer los paréntesis. De igual modo, (B7 +A!) (AB) = 
I (¡compruébelo!), de modo que AB es invertible y su inversa es B7%A”?. 


(e) La idea básica aquí es suficientemente sencilla. Por ejemplo, cuando n = 2, se tiene 


AA? = A A pp! ATA? AA? I 
De igual modo, (47!)24? = I. Por ende, (A71)? es la inversa de A’. No es difícil ver que 
un argumento similar funciona para cualquier valor entero superior de n. Sin embargo, 
la inducción matemática es la forma de realizar la demostración. 
El paso básico es cuando n = 0, en cuyo caso se pedirá probar que A? es invertible y 
que 


(07 = (475)? 


Esto es lo mismo que demostrar que I es invertible y que 17? = I, lo que claramente es 
verdadero. (¿Por qué? Vea el ejercicio 16.) 

Ahora suponga que el resultado es verdadero cuando n = k, donde k es un entero no 
negativo específico. Esto es: la hipótesis de inducción es suponer que A! es invertible y 
que 


(A5)! = (A) 
El paso de inducción requiere demostrar que A*** es invertible y que (4**!)! = 


(471). Ahora se sabe de (c) que A*t! = A*A es invertible, pues A y (por hipótesis) A* 
son ambos invertibles. Más aún, 


(Aye = (ATHA! 
= (AP IA? or la hipótesis de inducción 
P P 


= (AA) por la propiedad (c) 
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Por tanto, A” es invertible para todo entero no negativo n y (4”)* = (A7?)” por el prin- 
cipio de inducción matemática. — A 
Comentarios 


+ Aunque todas las propiedades del Teorema 3.9 son útiles, (c) es la que se debe 
destacar. Acaso sea la más importante propiedad algebraica de las inversas de matrices. 
También es la que es más fácil de que salga mal. En el ejercicio 17 se le pedirá propor- 
cionar un contraejemplo para demostrar que, contrario a lo que se quisiera, (AB)? + 
AB”! en general. La propiedad correcta, (AB)? = B7!A”?, en ocasiones se conoce 
como la regla calcetas-zapatos, porque, aunque uno se pone las calcetas antes que los za- 
patos, se los quita en el orden inverso. 

+ La propiedad (c) generaliza los productos de un finito de matrices invertibles: si 
A, A,,..., A, son matrices invertibles del mismo tamaño, entonces A, A, + A, es inver- 
tible y 


(4,44 =A 5 AJA 


(Vea el ejercicio 18.) Por tanto, puede afirmarse: 


El inverso de un producto de matrices invertibles es el producto de sus inversas en el 
orden inverso. 


1 
F— + —, no debe esperar que para 


+ Dado que, para números reales, —— 
que, p a+b a b 


matrices cuadradas, (A + B) * = A"! + B`! (y, de hecho, esto no es cierto en general; 
vea el ejercicio 19). De hecho, excepto para matrices especiales, no hay fórmula para 
(A+ BJ). 

+ La propiedad (e) permite definir potencias enteras negativas de una matriz in- 
vertible: 


Si A es una matriz invertible y n es un entero positivo, entonces A~” se define por 


A” = (a7y = ( ce 


Con esta definición, puede demostrarse que las reglas para exponenciación, A'A' = A'** 
y (4”)' = A”, se sostienen para todos los enteros r y s, siempre que A sea invertible. 


Un uso de las propiedades algebraicas de las matrices es ayudar a resolver ecuaciones 
que involucran matrices. El siguiente ejemplo ilustra el proceso. Note que debe poner 
particular atención al orden de las matrices en el producto. 


Ejemplo 3.26 


> 


Resuelva la siguiente ecuación matricial para encontrar X (suponga que las matrices in- 
volucradas son tales que todas las operaciones indicadas están definidas): 


A UBX)" = (a7lB3y 
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Solución Existen muchas formas de proceder aquí. Una solución es 
AMUBX)? =(47B%?=> ((BX)A)* = (A'B? Y 
= [(BX)A)"J" =[(418]7 
> (BX)A = [(4B>(41B>)]" 
> (BA =B YA) UB YA)” 
= BXA = BABA 
= B 'BXAA ' = B BABA,” 
=> IXI = B*AB?I 
=X = B “AB”? 
»—= (¿Puede justificar cada paso?) Note el uso cuidadoso del Teorema 3.9(c) y el desarrollo 


de (A7*B?. También se usó libremente la asociatividad de la multiplicación de matrices 
para simplificar la colocación (o eliminación) de los paréntesis. 


La multiplicación de matrices se usará para dar una perspectiva diferente a la reducción 
de matrices por renglones. En el proceso, descubrirá muchos nuevos e importantes co- 
nocimientos de la naturaleza de las matrices invertibles. 


Si 
10 0 5 7 
E=|0 0 1| y A=|-1 0 
0.1.0 8 3 
se encuentra que 
5 
EA=| 8 3 


En otras palabras, multiplicar A por E (a la izquierda) tiene el mismo efecto que inter- 
cambiar los renglones 2 y 3 de A. ¿Qué es lo significativo de E? Simplemente es la matriz 
que se obtiene al aplicar la misma operación elemental con renglones, R, + Ry, a la ma- 
triz identidad I}. Es evidente que esto siempre funciona. 


Definición Una matriz elemental es aquella matriz que puede obtenerse al rea- 
lizar una operación elemental con renglones sobre una matriz identidad. 


Dado que existen tres tipos de operaciones elementales con renglones, existen tres 
tipos correspondientes de matrices elementales. He aquí algunas de las matrices más ele- 
mentales. 


Ejemplo 3.27 | Sean 


1000 0.0.1.0 1.000 
0.3.0.0 0.1.0.0 0. 100 

E, = -pS z 

Flo o1 0 2211000 Y E=slo 010 
0.0.0.1 0.0.0 1 0-20 1 
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Cada una de esas matrices se obtuvo a partir de la matriz identidad 1, al aplicar una sola 
operación elemental con renglones. La matriz E, corresponde a 3R,, E, a R, SR, y Ez a 
R, — 2R,. Observe que cuando se multiplica por la izquierda una matriz de 4 X n por 
una de tales matrices elementales, la correspondiente operación elemental con renglones 
se realiza sobre la matriz. Por ejemplo, si 


entonces 
E 431 A32 03 
3a 3a 3a a a a 
21 22 23 21 n l3 
EjA $ E,A > 
431 An dz 4 An M3 
da Ap Ay da Any Ag 
411 412 413 
421 4 43 
y EA = 
431 432 433 


Aa T 2433 Ap — 24) Maz — 24) 


El ejemplo 3.27 y los ejercicios 24-30 deben convencerlo de que cualquier operación 
elemental con renglones sobre cualquier matriz puede lograrse al multiplicar por la iz- 
quierda por una matriz elemental adecuada. Este hecho se registra como teorema, del 
que se omite la demostración. 


Teorema 3.10 


Sea E la matriz elemental que se obtiene al realizar una operación elemental con ren- 
glones sobre I„. Si la misma operación elemental con renglones se realiza sobre una 
matriz A de n X n, el resultado es el mismo que la matriz EA. 


Comentario Desde un punto de vista computacional, no es buena idea usar matri- 
ces elementales para realizar operaciones elementales con renglones, sólo hágalas direc- 
tamente. Sin embargo, las matrices elementales pueden proporcionar algunas intuicio- 
nes valiosas acerca de las matrices invertibles y la solución de sistemas de ecuaciones 
lineales. 


Ya se observó que toda operación elemental con renglones puede “deshacerse” o “in- 
vertirse”. Esta misma observación aplicada a matrices elementales muestra que son in- 
vertibles. 


Ejemplo 3.28 


Sean 


O =- © 
Roo 
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Entonces E, corresponde a R, £R,, que se deshace al efectuar R, <> R, nuevamente. Por 
tanto, E, 7? = E,. (Compruebe al demostrar que Ej = E,E, = I.) La matriz E, proviene de 
4R,, que se deshace al aplicar ¿R,. Por tanto, 


o 
o 


O ein 
pa 


que puede comprobarse con facilidad. Finalmente, E, corresponde a la operación ele- 
mental con renglones R, — 2R,, que puede deshacerse mediante la operación elemental 
con renglones R, + 2R,. De modo que, en este caso, 


1 0 0 
E'=ļ|0 1 0 
2 0 1 


(Nuevamente, es fácil comprobar esto al confirmar que el producto de esta matriz y E,, 


en ambos órdenes, es 1.) 


Note que no sólo cada matriz elemental es invertible, sino que su inversa es otra ma- 
triz elemental del mismo tipo. Este hallazgo se registra como el siguiente teorema. 


Teorema 3.11 


Cada matriz elemental es invertible y su inversa es una matriz elemental del mismo 
tipo. 


El teorema fundamental de las matrices invertibles 


Ahora está en posición de probar uno de los principales resultados de este libro: un con- 
junto de caracterizaciones equivalentes de lo que significa para una matriz ser invertible. 
En un sentido, gran parte del álgebra lineal está conectada a este teorema, ya sea en el de- 
sarrollo de dichas caracterizaciones o en su aplicación. Como puede esperar, dada esta 
introducción, este teorema se usará bastante. ¡Hágalo su amigo! 

Al Teorema 3.12 se le conocerá como la primera versión del teorema fundamental, 
pues se le harán agregados en capítulos posteriores. Se le recuerda que, cuando se dice que 
un conjunto de enunciados acerca de una matriz A son equivalentes, se entiende que, para 
una A dada, los enunciados son todos verdaderos o todos falsos. 


Teorema 3.12 


El teorema fundamental de las matrices invertibles: versión 1 


Sea A una matriz de n X n. Los siguientes enunciados son equivalentes: 


A es invertible. 

Ax = b tiene una solución única para todo b en R”. 
Ax = 0 tiene sólo la solución trivial. 

La forma escalonada reducida por renglones de A es I,. 
A es un producto de matrices elementales. 


ES 
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Demostración Fl teorema se establecerá al demostrar la cadena circular de implicacio- 
nes 


(a) > (b) > (c) > (d) = (e) = (a) 
(a) = (b) Ya se demostró que si A es invertible, entonces Ax = b tiene la solución 
única x = A” 'b para cualquier b en R” (Teorema 3.7). 


(b) => (c) Suponga que Ax = b tiene una solución única para cualquier b en R”. 
Esto implica, en particular, que Ax = 0 tiene una solución única. Pero un sistema ho- 
mogéneo Ax = 0 siempre tiene x = 0 como una solución. Así que, en este caso, x = 0 
debe ser la solución. 


(c) => (d) Suponga que Ax = 0 sólo tiene la solución trivial. El correspondiente sis- 
tema de ecuaciones es 


AX; F AX + + + AinXn = 0 


aX F aky Toe + AXi 


apXı t Ap F + apla = 0 
y se supone que esta solución es 
Xx =0 
X =0 
x, =0 


En otras palabras, la eliminación de Gauss-Jordan aplicada a la matriz aumentada del 
sistema produce 


4 An Ain | 0 1.0 010 

Aa An Aa | 0 0 1 010 | =T[1/0 
[4/0] = — [1,10] 

An an ai Ann 0 0 0 ES 1 0 


Por tanto, la forma escalonada reducida por renglones de A es I. 


(d) => (e) Si supone que la forma escalonada reducida por renglones de A es I, en- 
tonces A puede reducirse a I, usando una secuencia finita de operaciones elementales 
con renglones. Por el Teorema 3.10, cada una de dichas operaciones elementales con ren- 
glones puede lograrse al multiplicar la izquierda por una matriz elemental adecuada. Si 
la secuencia adecuada de matrices elementales es E}, E,, . . . , E, (en ese orden), entonces 
se tiene 


Ex dE BEA = la 


De acuerdo con el Teorema 3.11, dichas matrices elementales son todas invertibles. Por 
tanto, también lo es su producto, y se tiene 


A= {Biera h= (Eo ELE) e a 
De nuevo, cada E; es otra matriz elemental, por el Teorema 3.11, así que A se escribió 


como un producto de matrices elementales, como se requería. 


(e) = (a) si A es un producto de matrices elementales, entonces A es invertible, pues 
las matrices elementales son invertibles y los productos de las matrices invertibles son in- 
vertibles. — 
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Ejemplo 3.29 


“Nunca lleve un cañón al esce- 
nario en el primer acto, a menos 
que pretenda dispararlo en el úl- 
timo acto” —Anton Chejov 


2 3 
Si es posible, exprese A = | i j como un producto de matrices elementales. 


Solución Se reduce A por renglones del modo siguiente: 


ai >] gh al ml al 
1 3 2 3 0 -3 


Rı+R, f 0 —IR, 1 0 
0 =3 g 0 1 = l, 


Por tanto, la forma escalonada reducida por renglones de A es la matriz identidad, así 
que el teorema fundamental asegura que A es invertible y puede escribirse como un pro- 
ducto de matrices elementales. Se tiene E,E,E,E,A = I, donde 


aaa 
1 fi oP >? la aP >? lo 1 * lo = 


son las matrices elementales correspondientes a las cuatro operaciones elementales con 
renglones utilizadas para reducir A a I. Como en la prueba del teorema, se tiene 


A = (BEEE) = EPEE E = |0 T I of: al 
Eds dp 1 2 3 4 1 0 2 1 0 1 0 =3 


como se requiere. 


Comentario Puesto que la secuencia de operaciones elementales con renglones que 
transforma A en I no es única, tampoco lo es la representación de A como producto de 
matrices elementales. (Encuentre una forma diferente de expresar A como un producto 
de matrices elementales). 


El teorema fundamental es sorprendentemente poderoso. Para ilustrar su poder, 
considere dos de sus consecuencias. La primera es que, aunque la definición de una ma- 
triz invertible afirma que una matriz A es invertible si existe una matriz B tal que tanto 
AB = I como BA = I se satisfacen, sólo es necesario comprobar una de dichas ecuacio- 
nes. Por tanto, ¡puede reducirse el trabajo a la mitad! 


Teorema 3.13 


Sea A una matriz cuadrada. Si B es una matriz cuadrada tal que AB = I o BA = I, 
entonces A es invertible y B = A”. 


Demostración Suponga BA = I. Considere la ecuación Ax = 0. Al multiplicar por la iz- 
quierda por B, se tiene BAx = BO. Esto implica que x = Ix = 0. Por tanto, el sistema re- 
presentado por Ax = 0 tiene la solución única x = 0. A partir de la equivalencia de (c) y 
(a) en el teorema fundamental, se sabe que A es invertible. (Esto es: existe A”? y satisface 
AA '=I=A"A,) 

Si ahora multiplica por la derecha ambos lados de BA = I por A”, obtiene 


BAA!'=IA1>BI=A!'=>B=A"! 


(La demostración en el caso de AB = I se deja como ejercicio 41.) _ 3 


La siguiente consecuencia del teorema fundamental es la base de un método eficiente 
para calcular la inversa de una matriz. 
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Teorema 3.14 Sea A una matriz cuadrada. Si una secuencia de operaciones elementales con renglo- 


nes reduce A a I, entonces la misma secuencia de operaciones elementales transforma 
TenA?. 


Demostración Si A es equivalente por renglones a I, entonces puede lograrse la reduc- 
ción mediante multiplicación por la izquierda por una secuencia E}, E,, . . . , E, de matri- 
ces elementales. Por tanto, se tiene E, +++ E,E,A = I. Al hacer B = E, +++ E,E, se obtiene BA 
= 1. Por el Teorema 3.13, A es invertible y A~? = B. Ahora, aplicar la misma secuencia de 
operaciones elementales con renglones a I equivale a multiplicar por la izquierda I por 
E, ** E,E, = B. El resultado es 


E BEI = BI = B = A` 


Por tanto, I se transforma en A”? mediante la misma secuencia de operaciones elemen- 
tales con renglones. — 


Es posible realizar operaciones con renglones sobre A e I simultáneamente al construir 
una “matriz superaumentada” [A|1]. El Teorema 3.14 muestra que si A es equivalente 
por renglones a I [lo cual, por el teorema fundamental (d) <> (a), significa que A es in- 
vertible], entonces operaciones elementales con renglones producirán 


[411] — [1/47] 


Si A no puede reducirse a I, entonces el teorema fundamental garantiza que A no es in- 
vertible. 

El procedimiento recién descrito es simplemente la eliminación de Gauss-Jordan 
efectuada sobre una matriz aumentada de n X 2n, en lugar de sobre una de n X (n + 1). 
Otra forma de ver este procedimiento es observar el problema de encontrar A” al resol- 
ver la ecuación matricial AX = I, para una matriz X de n X n. (Esto es suficiente, por el 
teorema fundamental, pues una inversa correcta de A debe ser una inversa de dos lados.) 
Si las columnas de X se denotan X;, . . . , X„ entonces esta ecuación matricial es equiva- 
lente a resolver para las columnas de X, una a la vez. Dado que las columnas de I, son los 
vectores unitarios estándar e,,..., €„ entonces se tienen n sistemas de ecuaciones linea- 
les, todas con matriz de coeficientes A: 


AX, = €j,..., AX, = €, 


Dado que se necesita la misma secuencia de operaciones con renglones para llevar A 
a la forma escalonada reducida por renglones en cada caso, las matrices aumentadas 
para estos sistemas, [A | e,],..., [A | e,], pueden combinarse como 


[A] e,e, +: €e,] = [A | 1,] 


Ahora se aplican operaciones con renglones para tratar de reducir A a I, lo cual, si tiene 


m 


éxito, resolverá simultáneamente para las columnas de A”*, lo que transformará 1, en 
AT 1 
Este uso de la eliminación de Gauss-Jordan se ilustra con tres ejemplos. 


Encuentre la inversa de 


si existe. 
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Solución La eliminación de Gauss-Jordan produce 


1 2 -1|11 0 0 
[411] =|2 2 4ļ0 1 0 
1 3 —3|0 0 1 
RR [1] 2 -1| 100 
R;—R; 
—|0 -2 6|-2 1 0 
0 1 —2|-1 0 1 
, 1 2 -1| 1 00 
(DR, 1 
=> |0 1 =3 I = 0 
0 1 -2|-1 0 1 
1 2 -1| 1 00 
RR, i 
—> |0 1-31 — 0 
00 di-2 +1 
R +R 1 
1 2 0|-1 5 1 
R,+3R, 
—>|0 1 0|-5 1 3 
0 0 -2 3 1 
1 0 0| 9 —} -5 
R,—2R, 
—= |o 1 0|-5 1. 3 
0.0 -2 3 1 


Por tanto, 


$ 2 =5 
Atl=|-=5 1 3 
-2 3 1 


(Siempre debe comprobar que AA™! = I mediante multiplicación directa. Por el Teo- 
rema 3.13, no necesita comprobar que también A7!A = 1.) 


Comentario Note que se usó la variante de eliminación de Gauss-Jordan que pri- 
mero introduce todos los ceros abajo de los 1 pivote, de izquierda a derecha y de arriba 
abajo, y luego crea ceros arriba de los 1 pivote, de derecha a izquierda y de abajo arriba. 
Este planteamiento ahorra cálculos, como se anotó en el capítulo 2, pero puede encon- 
trarlo más sencillo, cuando trabaja a mano, para crear todos los ceros en cada columna 
conforme avance. Desde luego, la respuesta será la misma. 


Ejemplo 3.31 Encuentre la inversa de 


2 1 4 
A=|-4 -l1 6 
=2 2 =2 


si existe. 
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Solución  Proceda como en el ejemplo 3.30, adjunte la matriz identidad a A y luego 
trate de convertir [A | I] en [1/47*]. 


2 1 -4|]1 0 0 
[A] =|-4 -1 6/0 1 0 
-2 2 -2l0o 0 1 
RR [2 1 —4|1 0 0 
EE lo 1 -2|2 1 0 
0 3 -6|11 0 1 
ai [17 ALL A 
—> lo 1-32 10 
o0 0 oļ-5 -3 1 


En este punto se ve que no es posible reducir A a I, pues existe un renglón de ceros en el 
lado izquierdo de la matriz aumentada. En consecuencia, A no es invertible. 


Como ilustra el ejemplo siguiente, todo funciona de la misma forma sobre Z,, donde 
p es primo. 


Ejemplo 3.32 


Encuentre la inversa de 


si existe, sobre Z}. 


Solución 1 Use el método de Gauss-Jordan y recuerde que todos los cálculos son en Z,. 


P2 211 0] 
[A] 1] = 
12 ojo 1] 
22 [1 1|2 0] 
— 
[2 olo 1) 
rir [1 1|2 0] 
>lo ad 1] 
R+2R [1 olo 2] 
lo 1|2 1] 


0 2 
Por tanto, A! = k a y es fácil comprobar que, sobre Z}, AA”! = I. 


Solución 2 Dado que A es una matriz de 2 X 2, también puede calcular A7* usando la 
fórmula dada en el Teorema 3.8. El determinante de A es 


det A = 2(0) — 2(2) = -1 = 2 


en Z, (ya que 2 + 1 = 0). Por tanto, A”? existe y está dada por la fórmula del Teorema 3.8. 
Sin embargo, aquí debe tener cuidado, porque la fórmula introduce la “fracción” 1/det A 
y en Z, no existen fracciones. Debe usar inversos multiplicativos en lugar de división. 
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En lugar de 1/det A = 1/2, use 27}; esto es, encuentre el número x que satisfaga la 
ecuación 2x = 1 en Z,. Es fácil ver que x = 2 es la solución que se quiere: en Z, 27! = 2, 
pues 2(2) = 1. La fórmula para A”? ahora se convierte en 


AA a 


que concuerda con la solución anterior. 
Ejercicios 3.3 
0 > 
En los ejercicios 1-10, encuentre la inversa de la matriz dada nunciada, y esto explica por qué los sistemas de 
(si existe) usando el Teorema 3.8. cómputo no usan uno de dichos métodos para re- 


solver sistemas lineales. 


Ta 7 11.2 14. Demuestre el Teorema 3.9(b). 
E [1 J i: [3 4 15. Demuestre el Teorema 3.9(d). 
Ñ Ñ 16. Demuestre que la matriz identidad 1, de n X n es inver- 
3 3 l a° a tible y que I; * = I, 
L6 8 L1 0 17. (a) Proporcione un contraejemplo para demostrar que 
Š i a r 1/ V2 UVA (AB) *%A"'B”! en general. 
es lyv 1v2 
T-15 -42 13.55 0.25 (b) ¿En qué condiciones de A y B,(AB)*= ABR 
7 05 2 l "|852 0 z| Pruebe su afirmación. 
9." E 18. Mediante inducción, demuestre que siA,,A,,...,A, 
- b a son matrices invertibles del mismo tamaño, entonces el 
10 — a donde ni a, b, c ni d son 0 producto A,A,***A, es invertible y (A4,A3: A) = A% 
“L1/c 1/d ai i <- AZAL.. 


19. Proporcione un contraejemplo para demostrar que en 


=l =] =] 
En los ejercicios 11 y 12, resuelva el sistema dado usando el mé- general (A +B) #A +B. 


todo del ejemplo 3.25. To ; Pe 
En los ejercicios 20-23, resuelva la ecuación matricial dada 
L r para X. Simplifique sus respuestas tanto como sea posible. (En 
Meager y l ai= gm palabras de Albert Einstein, “todo debe hacerse tan simple 
5x + 3y= 2 x+2x=5 como sea posible, pero no más sencillo”) Suponga que todas 

1 2 3 =ï 2 las matrices son invertibles. 
seais i 3o-Eja- [jr [] 

2 6 5 2 0 


20. XA? = 4? 21. AXB = (BA)? 
(a) Encuentre A”? y úselo para resolver los tres sistemas 22. (AX)? =(ABI) UAB) 23,ABXA IB"? =I+A 
Ax = b,, Ax = b, y Ax = b,. 
(b) Resuelva los tres sistemas al mismo tiempo me- En los ejercicios 24-30, sean 
diante la reducción por renglones de la matriz au- 


mentada [A | b, b, b,], usando la eliminación de i A Lal o 
Gauss-Jordan. A= ld 1 11) B=|1 1 1j, 
(c) Cuente cuidadosamente el número total de multi- L =i 0 1 2 =1 
plicaciones individuales que realizó en (a) yen (b). 1 2 -1 1 2-1 
Debe descubrir que, incluso para este ejemplo de E z 
z i : C=|1 1 lh D=|=3 =1 3 
2 X 2, un método usa menos operaciones. Para sis- dq i i i i 


temas más grandes, la diferencia es incluso más pro- 


En cada caso, encuentre una matriz elemental E que satisfaga 
la ecuación dada. 


24. EA = B 25.EB = A 26.EA = C 

27. EC = A 28. EC = D 29. ED = C 

30. ¿Existe una matriz elemental E tal que EA = D? ¿Por 
qué sí o por qué no? 


En los ejercicios 31-38, encuentre la inversa de la matriz ele- 
mental dada. 


[2 a[i? 
0 1 0 1 
aJ all 

1 0 =z 1 

1 0 0 0 0 1 
35.10 1 -2 36. f 1 0 

0 0 1 10.0 

1 0 0 1 0 0 
37.10 c 0|,c+0 38. |0 1 c|cx*x0 

0 0 1 0 0 1 


En los ejercicios 39 y 40, encuentre una secuencia de matrices 
elementales E,, E,, . . . , E, tal que E, *** E,E, A = I. Use esta 
secuencia para escribir A y A™' como productos de matrices 


elementales. 
1 0 2 4 
wi an 
=] =2 1 1 


41. Demuestre el Teorema 3.13 para el caso de AB = I. 


42. (a) Demuestre que si A es invertible y AB = O, enton- 
ces B = O. 


(b) Ofrezca un contraejemplo para demostrar que el re- 
sultado en el inciso (a) puede fallar si A no es in- 
vertible. 

43. (a) Demuestre que si A es invertible y BA = CA, enton- 
ces B = C. 


(b) Ofrezca un contraejemplo para demostrar que el re- 
sultado en el inciso (a) puede fallar si A no es in- 
vertible. 

44. Una matriz cuadrada A se llama idempotente si A? = 

(La palabra idempotente viene de la palabra latina idem, 


» 


que significa “igual”, y potere, que significa “tener poder”. 


Por tanto, algo que es idempotente tiene “la misma po- 

tencia” cuando se eleva al cuadrado.) 

(a) Encuentre tres matrices de 2 X 2 idempotentes. 

(b) Demuestre que la única matriz de n X n idempo- 
tente invertible es la matriz identidad. 


45. Demuestre que si A es una matriz cuadrada que satisface 
la ecuación A? — 2A + I = O, entonces A! = 2I — A. 
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46. Demuestre que si una matriz simétrica es invertible, en- 
tonces su inversa también es simétrica. 

47. Demuestre que si A y B son matrices cuadradas, y AB es 
invertible, entonces A y B son invertibles. 


En los ejercicios 48-63, use el método de Gauss-Jordan para 
encontrar la inversa de la matriz dada (si existe). 


l1 2 
as. | 49. E A] 
3 4 
E [a 
50. 51. 
—6 8 
2 =] Il —1 2 
52. | 1 1 53. |3 1 2 
2 3 0 2 3 = 
1 1:00 a 0 0 
54.|1 1 1 55.|1 a 0 
0 1 1 0 1 a 
0 —1 1 0 
e 2 1 0 2 
56.|b 0 c 57. 
1 -1 3 0 
0d 0 
0 1.1 -—1 
v 0 2V2 0 
En =4V2 v2 0 0 
` 0 0 1 0 
0 0 3 1 
1 0 0 0 
0 
59. O 60 | [sobre z 
0 0 1 0 1 
abcd 
2 l 0 
4 2 
e! 2 sobre Z; 62. |1 1 2 [sobre Z, 
0 2 1 
1.5.0 
63.|1 2 4|sobreZ, 
3 6 1 


Particionar matrices cuadradas grandes en ocasiones puede 
hacer que sus inversas sean más fáciles de calcular, en particu- 
lar si los bloques tienen una forma manejable. En los ejercicios 
64-68, verifique mediante multiplicación por bloque que la in- 
versa de una matriz, si se particiona como se muestra, es como 
se afirma. (Suponga que todas las inversas existen como se ne- 
cesita.) 


f T ES el 
64. = ” 
O -D O D! 
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TO B|! (BOT (BC) *B En los ejercicios 69-72, particione la matriz dada de modo que 
65. [C I = C(BC)™! I- C(BC)`'B pueda aplicar una de las fórmulas de los ejercicios 64-68, y 
I Ba (I — BC)" -(I - BO) 8 luego calcule la inversa usando dicha fórmula. 
66. = 
C i Ea -BO I+ C(I- ~A AL 
r z 0100 
O Bl” ; 
67. c al is 2 3 1 0 
BDC)” (BDC) BD" y ae 
= D"IC(BDC)" D — D”C(BD”IC) "BD"! 70. La matriz del ejercicio 58 
68. | | -| | donde P = (A — BD™!C)™!, a 
Co ROS ali * Le Alisa 
Q = —PBD™!, R = —-D`!CP, y S =D"! + D"ICPBD”' 0 =1 10 1523 
1 1 0 1 


La factorización LU 


Así como es natural (e ilustrador) factorizar un número natural en un producto de otros 
números naturales (por ejemplo, 30 = 2 + 3 - 5), frecuentemente también es útil factori- 
zar matrices como productos de otras matrices. Cualquier representación de una matriz 
como producto de dos o más matrices se llama factorización de matrices. Por ejemplo, 


> == le llo 


es una factorización de una matriz. 

No es necesario decir que algunas factorizaciones son más útiles que otras. En esta 
sección se presenta una factorización matricial que surge en la solución de sistemas de 
ecuaciones lineales mediante eliminación gaussiana y es particularmente adecuada para 
su implementación en computadora. En capítulos posteriores se encontrarán otras fac- 
torizaciones matriciales igualmente útiles. De hecho, el tema es rico, y a él se han dedi- 
cado libros y cursos enteros. 

Considere un sistema de ecuaciones lineales de la forma Ax = b, donde A es una ma- 
triz de n X n. La meta de este libro es demostrar que la eliminación gaussiana implícita- 
mente factoriza A en un producto de matrices que permiten resolver fácilmente el sistema 
dado (y cualquier otro sistema con la misma matriz de coeficientes). 

El siguiente ejemplo ilustra la idea básica. 


El gran matemático inglés 

Alan M. Turing (1912-1954) 
introdujo la factorización LU en 
1948, en un ensayo titulado 
“Rounding-off Errors en Matrix 
Processes” (Quarterly Journal of 
Mechanics and Applied Mathematics, 
1 (1948), pp. 287-308). Durante la 
segunda guerra mundial, Turing fue 
útil para descifrar el código 
“Enigma” alemán. Sin embargo, es 
mejor conocido por su trabajo en 
lógica matemática que tendió los 
cimientos teóricos para el desarrollo 
de las computadoras digitales y el 
moderno campo de la inteligencia 
artificial. La “prueba de Turing” que 
propuso en 1950 todavía se usa 
como uno de los hitos para abordar 
la cuestión de si una computadora 
puede considerarse “inteligente”. 
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La reducción por renglones de A se realiza del modo siguiente: 


2 13 i 3l [2 1 3 
R;+R;, 3 2 
A= £ =l 3|—>|0.=3 = a a =3|[=0U (1) 
=2 5 5 0 6 8 0 0 2 


Las tres matrices elementales E,, E,, E, que logran esta reducción de A a la forma escalo- 
nada U son (en orden): 


1 0 0 1 0 0 100 
E =|-2 1 0|, E,=]|0 0 E¿=|0 1 0 
0.01 1 O 1 0 2 1 
Por tanto, 
E,E,E,A = U 
Al despejar para A, se obtiene 
1 0 0 1 0 OJ|1 0 0 
A =E E E U=|2 1 0 0 1 ollo 1 O|U 
0 0 1jL-1 O 1/0 =2 
1 0 0 
= 2 1 0 |U= LU 
=i =2 «ll 
Por tanto, A puede factorizarse como 
A= LU 


donde U es una matriz triangular superior (vea los ejercicios para la sección 3.2) y L es 
triangular inferior unitaria. Esto es, L tiene la forma 


0 0 
+l 0 
L= ; 
E E 1 
con ceros arriba y números 1 en la diagonal principal. | 


El ejemplo anterior motiva la siguiente definición. 


Definición Sea A una matriz cuadrada. Una factorización de A como A = LU, 
donde L es triangular inferior unitaria y U es triangular superior, se llama factoriza- 
ción LU de A. 


Comentarios 

+ Observe que la matriz A en el ejemplo 3.33 tiene una factorización LU porque en 
la reducción por renglones de A no se necesitaron intercambios de renglón. Por tanto, 
todas las matrices elementales que surgieron fueron triangulares inferiores unitarias. En- 
tonces, se garantiza que L es triangular inferior unitaria porque los inversos y productos 
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de matrices triangulares inferiores unitarias también son triangulares inferiores uni- 
tarias. (Vea los ejercicios 29 y 30.) 

Si apareciera un cero en una posición pivote en algún paso, habría tenido que inter- 
cambiar renglones para obtener un pivote distinto de cero. Esto habría resultado en que 
L ya no fuese triangular inferior unitaria. Más adelante se comentará más acerca de esta 
observación. (¿Puede encontrar una matriz para la cual será necesario el intercambio de 
renglones?) 

+ La noción de una factorización LU puede generalizarse a matrices no cuadradas 
al simplemente requerir que U sea una matriz en forma escalonada por renglones. (Vea 
los ejercicios 13 y 14.) 

+ Algunos libros definen una factorización LU de una matriz cuadrada A como 
cualquier factorización A = LU, donde L es triangular inferior y U es triangular superior. 


El primer comentario anterior en esencia es una demostración del siguiente teorema. 


Teorema 3.15 


Si A es una matriz cuadrada que puede reducirse a forma escalonada sin usar inter- 
cambios de renglón, entonces A tiene una factorización LU. 


Para ver por qué es útil la factorización LU, considere un sistema lineal Ax = b, 
donde la matriz de coeficientes tiene una factorización LU, A = LU. El sistema Ax = b 
puede reescribirse como LUx = b o L(Ux) = b. Si ahora se define y = Ux, entonces es 
posible resolver para x en dos etapas: 


1. Resolver Ly = b para y mediante sustitución hacia adelante (vea los ejercicios 25 y 26 
en la sección 2.1). 
2. Resolver Ux = y para x mediante sustitución hacia atrás. 


Cada uno de dichos sistemas lineales tiene solución directa porque las matrices coefi- 
ciente L y U son ambas triangulares. El siguiente ejemplo ilustra el método. 


> 
Ejemplo 3.34 2 13 
Use una factorización LU de A = 4 —1 3 para resolver Ax = b, donde 
1 =2 5 5 
b= | —4 
9 


1 0 0||2 1 3 


=] =2 1]L0 0 2 


Como se destaca líneas arriba, para resolver Ax = b (que es lo mismo que L(Ux) = b), 


1 
primero se resuelve Ly = b para y = f . Este es justo el sistema lineal 
y3 
yı = 1 
2y + ya ==4 


=y T 2y, ty = 9 


La sustitución hacia adelante (esto es, al trabajar de arriba abajo) produce 


Y =1y,= 74 2y = —6,y;, =9 + y, + 2y, = -2 
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1 X 
Por tanto, y = | —6 | y ahora se resuelve Ux = y para x = | x |. Este sistema lineal es 
=2 X3 


2x, + X% +t 3x% = 1 
—3x, 33 = =6 
2x; = —2 
y la sustitución hacia atrás produce rápidamente 
x=-l, 


—3x, = —6 + 3x, = —9 de manera que x, = 3, y 


NS 


2x, = 1 — x% — 3x3 = 1 de manera que x; = 


il 
2 

Por tanto, la solución al sistema dado Ax = b es x = 3 |- 
=] 


md 


En el ejemplo 3.33 se calculó la matriz L como un producto de matrices elementales. Por 
fortuna, L puede calcularse directamente a partir del proceso de reducción por renglo- 
nes sin la necesidad de calcular matrices elementales. Recuerde que se supone que A 
puede reducirse a forma escalonada por renglones sin usar intercambios de renglón. Si 
este es el caso, entonces todo el proceso de reducción por renglones puede hacerse 
usando solamente operaciones elementales con renglones de la forma R; — KR; (¿Por 
qué no es necesario usar la operación elemental con los renglones restantes, y multipli- 
car un renglón por un escalar distinto de cero?) En la operación R, — kR, el escalar k se 
denominará el multiplicador. 

En el ejemplo 3.33, las operaciones elementales con renglones que se usaron fueron, 
en orden, 


Una forma sencilla de encontrar factorizaciones LU 


Ry =2R; (multiplicador = 2) 
R,+R,=R,-(-DR, (multiplicador = —1) 
R, + 2R, = R, — (-2)R, (multiplicador = —2) 


¡Los multiplicadores son precisamente las entradas de L que están bajo su diagonal! De 
hecho, 


1 00 
L= 2 1 
=i =2 1 
y La = 2, L3, = =1 y L}, = 2. Note que la operación elemental con renglones R; — kR; 


tiene su multiplicador k en la entrada (i, j) de L. 


Encuentre una factorización LU de 


Ww 
UNA 
u 
| 
Si 
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Solución Al reducir A a forma escalonada por renglones se obtiene 


3 1 3 —4 R,—2R, 5 1 3 —4 
6 4 8 —10 |R-R 0 2 2 =2 
A= R,—(—3)R, 
3 2 5 =] > 0 1 2 3 
=9 5 =-2 -4 0 8 7 -16 
3 1 3 —4 
R= — 
RAR 0 2 2 2 
2100 1 4 
0.0 =1 -8 
3 1 —4 
Ri=(71)Ry 0 2 
$ =U 
0 0 
0 0 


O - N uy 
| 
N 


Los primeros tres multiplicadores son 2, 1 y —3, y van en las entradas subdiagonales de 
la primera columna de L. De modo que, hasta el momento, 


— 
© 


= N 

+$ = 
* HO oo 
= O O o 


1000 
2100 
L= i 
1.310 
-3 4 x* 1 


1 0 0 0 
2 1 0 0 
L= i 
1 10 
=3 4 =] 1 
Por tanto, una factorización LU de A es 
3 1 3 —4 1 0 0 0 3 1 3 —4 
6 4 8 —10 2 1 0 0 0 2 2 =2 
A= = a = LU 

3 2 5 =] l 3 1 0 0 0 1 4 
=9 5 -2 4 =3 4 =] 1 0 0 0 —4 


como se comprueba fácilmente. 


Sección 3.4 La factorización LU 191 


Comentarios 

+ Al aplicar este método es importante notar que las operaciones elementales con 
renglones R; — kR, deben realizarse de arriba abajo dentro de cada columna (y usar la en- 
trada diagonal como pivote) y columna por columna de izquierda a derecha. Para ilus- 
trar lo que puede salir mal si no se obedecen estas reglas, considere la siguiente reducción 
por renglones: 


12.2 L 2 2 1 2 2 
R,—2R, R,—R; 
A=|1 1 1|—>|1 1 l1Ii|—>|0 =I -1|=U 
2 2 1 0.0 =l 0 0. =l 


Esta vez el multiplicador se colocaría en L del modo siguiente: L}, = 2, L,, = 1. Se ob- 
tendría 


1 0 0 
L=|1 1 0 
0 2 1 


pero A + LU. (¡Compruebe esto! Encuentre una factorización LU correcta de A.) 

+ Una forma alternativa de construir L es observar que los multiplicadores pueden 
obtenerse directamente de las matrices obtenidas en los pasos intermedios del proceso 
de reducción por renglones. En el ejemplo 3.33, examine los pivotes y las correspon- 
dientes columnas de las matrices que surgen en la reducción por renglones 


2 1 3 2 1 3 2 1 3 
A= 4 -1 3|>4/=|0 -3 -3|>|0 -3 -3|=U 
=2 5 5 0 6 8 0 0 2 


El primer pivote es 2, que aparece en la primera columna de A. Al dividir por el pi- 
vote las entradas de este vector columna que están en la diagonal o debajo de ella , se ob- 
tiene 


2 1 
1 
| 4|= 2 
2 
=2 =1 


El siguiente pivote es —3, que aparece en la segunda columna de A}. Al dividir por el pi- 
vote las entradas de este vector columna que están en la diagonal o debajo de ella, se ob- 
tiene 


ijela i 
=) 
= E 


El pivote final (que no es necesario usar) es 2, en la tercera columna de U. Al dividir por 
el pivote las entradas de este vector columna que están en la diagonal o debajo de ella, se 
obtiene 


Si los tres vectores columna resultantes se colocan lado a lado en una matriz, se tiene 


que es exactamente L una vez que las entradas sobre la diagonal se llenan con ceros. 


192 


Capítulo 3 Matrices 


En el capítulo 2 se remarcó que la forma escalonada por renglones de una matriz no 
es única. Sin embargo, si una matriz invertible A tiene una factorización LU, A = LU, en- 
tonces esta factorización es única. 


Teorema 3.16 


Si A es una matriz invertible que tiene una factorización LU, entonces L y U son úni- 
cas. 


Demostración Suponga A = LU y A = L,U, son dos factorizaciones LU de A. Entonces 
LU = L,U,, donde L y L} son triangulares inferiores unitarias y U y U} son triangulares 
superiores. De hecho, U y U, son dos formas escalonadas por renglones (posiblemente 
diferentes) de A. 

Por el ejercicio 30, L, es invertible. Dado que A es invertible, su forma escalonada re- 
ducida por renglones es una matriz identidad I por el teorema fundamental de matrices 
invertibles. Por tanto, U también se reduce por renglones a I (¿por qué?) y en conse- 
cuencia U también es invertible. Por lo cual, 


L '(LU)U™' = LP '(L,U,)U™ así (Ly 'LI(UU”) = (L,'L,(U,U””) 
En consecuencia, 
(LL) = {U U ') entonces L'LL = UU ' 
Pero L; 'L es triangular inferior unitaria por el ejercicio 29 y U U~" es triangular supe- 
rior. (¿Por qué?) Se tiene que L; 'L = U,U”! es tanto triangular inferior unitaria como 
triangular superior. La única matriz de esta forma es la matriz identidad, de modo que 


LI'L = Iy U¡U”! = I. Se tiene que L = L, y U = U}, de modo que la factorización LU 
de A es única. —— A 


La factorización P” LU 


Ahora se explorará el problema de adaptar la factorización LU para manejar casos donde 
son necesarios los intercambios de renglón durante la eliminación gaussiana. Considere 
la matriz 


Una reducción por renglón directa produce 


Lo «1 
ASTB=|0 0 5 
0 3 3 


que no es una matriz triangular superior. Sin embargo, esto se puede convertir fácilmente 
en forma triangular superior al intercambiar los renglones 2 y 3 de B para obtener 


1.2 =l 
U=|0 3 3 
0 0 5 


Alternativamente, primero puede intercambiar los renglones 2 y 3 de A. Para este fin, sea 
P la matriz elemental 


O O em. 
r. O o 
O = O 
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que corresponde a intercambiar los renglones 2 y 3, y sea E el producto de las matrices 
elementales que entonces reduce PA a U (de modo que E”? = L es triangular inferior 
unitaria). Por tanto, EPA = U, de modo que A = (EP) *U= PEU = P"!LU. 

Ahora esto sólo maneja el caso de un solo intercambio de renglón. En general, P será 
el producto P = P, +++ P,P, de todas las matrices que intercambian renglón P,, P,,...,P, 
(donde P, se realiza primero, etcétera). Tal matriz P se llama matriz permutación. Ob- 
serve que una matriz permutación surge de permutar los renglones de una matriz iden- 
tidad en cierto orden. Por ejemplo, las siguientes son todas matrices permutación: 


0 1 0 0 
0 0. 1 
0 1 0 0 0 1 
a E. 0 0] 
1.0 1 0 0 0 
0O 1 0 
0 0 1 0 


Por fortuna, el inverso de una matriz permutación es fácil de calcular; de hecho, ¡no se 
necesita cálculo alguno! 


Teorema 3.17 


Si P es una matriz permutación, entonces P™' = P". 


Demostración Debe demostrar que P*P = I. Pero el i-ésimo renglón de P" es igual que 
la ¡-ésima columna de P, y ambos son iguales al mismo vector unitario estándar e, por- 
que P es una matriz permutación. De este modo 


(P"P); = (i-ésimo renglón de P?) (i-ésima columna de P) = ele = e-e = 1 
Esto muestra que las entradas diagonales de P*P son todas 1. Por otra parte, si j # i, 


entonces la ¡-ésima columna de P es un vector unitario estándar diferente de e, por decir 
e'. Por tanto, una entrada típica fuera de la diagonal de P*P está dado por 


(PTP); = (i-ésimo renglón de P*)(¡-ésima columna de P) = ee! =e-e' = 0 


En consecuencia, P'P es una matriz identidad, como se quería demostrar. 


Por tanto, en general, puede factorizar una matriz cuadrada A como A = P~'LU = 
P"LU. 


Definición Sea A una matriz cuadrada. Una factorización de A como A = P"LU, 
donde P es una matriz permutación, L es triangular inferior unitaria y U es triangu- 
lar superior, se llama factorización P” LU de A. 


0 0 6 
Encuentre una factorización P"LUdeA =|1 2 3l. 
2 1 4 


Solución Primero reduzca A a forma escalonada por renglones. Claramente, es necesa- 
rio al menos un intercambio de renglón. 


0 0 6log [1 2 3] [2 3 
A=|1.2 3|—>|0 0 6|—>|0 0 6 
214 2 1 4 0 -3 -2 

ror |l 2 3 

= (0 =2 

0 0 6 
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Se usaron dos intercambios de renglón (R, 4> R, y luego R, <> R3), de modo que la ma- 
triz permutación requerida es 


1 0 0/10 1 0 0 1 0 
P=PP,=|0 0 1||1 0 O|=|0 O 1 
0 1 OJLO O 1 1 0 0 
Ahora se encuentra una factorización LU de PA. 
0 1 0[|0 0 6 1 2 3|-x E 2 3 
PA=|0 0 1|[|1 2 3|=|2 1 4|—> I0 -3 -2|=U 
1.0 0]|2 1 4 0 0 6 0 0 6 
Por tanto, L,, = 2, y por tanto 
0 0 1||1 0 0][|1 2 3 
A=PILU=|1 0 0||2 1 O||O -3 -2 
0 1 0J|0 O 1]JLO 0 6 


La discusión anterior justifica el siguiente teorema. 


Teorema 3.18 


Toda matriz cuadrada tiene una factorización P" LU. 


Comentario Incluso para una matriz invertible, la factorización P” LU no es única. 
En el ejemplo 3.36, un solo intercambio de renglón R, <> R, también habría funcio- 
nado, lo que conduciría a una P diferente. Sin embargo, una vez determinada P, L y U 
son únicas. 


Si A es de n X n, entonces el número total de operaciones (multiplicaciones y divisiones) 
requeridas para resolver un sistema lineal Ax = b usando una factorización LU de A, es 
T(n) = n?/3, el mismo que se requiere para la eliminación gaussiana. (Vea la Explora- 
ción “Operaciones de conteo”, en el capítulo 2.) Esto difícilmente es sorprendente, pues 
la fase de eliminación hacia adelante produce la factorización LU en = n*/3 pasos, 
mientras que las sustituciones hacia adelante y hacia atrás requieren = n?/2 pasos. Por 
tanto, para valores grandes de n, el término n'/3 es dominante. Desde este punto de 
vista, entonces, la eliminación gaussiana y la factorización LU son equivalentes. 
Sin embargo, la factorización LU tiene otras ventajas: 


+ Desde un punto de vista de almacenamiento, la factorización LU es muy com- 
pacta, porque puede sobreescribir las entradas de A con las entradas de L y U conforme se 
calculan. En el ejemplo 3.33 se encontró que 


2 1.3 1 0 0/|2 1 3 
A=| 4 -1 3|=]| 2 0[[0 =3 —3| = LU 
=2 555 =1 2- 11/60 0 2 
Esto puede almacenarse como 
a ES, 
2 3 


con las entradas colocadas en el oren (1, 1), (1,2), (1,3), (2, 1), (3, 1), (2, 2), (2, 3), (3,2), 
(3, 3). En otras palabras, las entradas subdiagonales de A se sustituyen con los multipli- 
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cadores correspondientes. (¡Compruebe que esto funciona!) 


+ Una vez calculada la factorización A de LU, puede usarse para resolver tantos sis- 
temas lineales de la forma Ax = b como se quiera. Sólo necesita aplicar el método del 


ejemplo 3.34 y variar el vector b cada vez. 


+ Para matrices con ciertas formas especiales, sobre todo aquellas con un gran 
número de ceros (las llamadas matrices “dispersas”) concentrados fuera de la diagonal, 
existen métodos que simplificarán el cálculo de una factorización LU. En estos casos, este 


método es más rápido que la eliminación gaussiana para resolver Ax = b. 


e Para una matriz invertible A, puede usarse una factorización LU de A para en- 
contrar A”?, si es necesario. Más aún, esto puede hacerse en tal forma que simultánea- 


mente produzca una factorización de A”?. (Vea los ejercicios 15-18.) 


Comentario Si tiene un CAS (como MATLAB) que tenga incluida la factorización 
LU, puede notar algunas diferencias entre sus cálculos a mano y el resultado de la compu- 
tadora. Esto se debe a que la mayoría de los CAS automáticamente tratarán de realizar pi- 
voteo parcial para reducir errores de redondeo. (Vea la exploración “Pivoteo parcial” en el 
capítulo 2.) El ensayo de Turing es una discusión extensa de tales errores en el contexto de 


las factorizaciones de matrices. 


Esta sección sirvió para presentar una de las factorizaciones matriciales más útiles. 


En capítulos posteriores se encontrarán otras igualmente útiles. 


|Hercicios 3.4 


En los ejercicios 1-6, resuelva el sistema Ax = b usando la fac- 
torización LU dada de A. 


e dez 


A A A 
2 3 3 1J[0 4 8 
2 1 -2 1 0 0 
sa- 3 -4|=|-1 10 
4-3 0 2 — 1 
2 1 -2 =3 
x|o 4 —6|,b=| 1 
0 0 = 0 
2 —4 0 100 
4A=| 3 -1 |- 5 10 
-1 22 =3 0 1 
2 —4 0 2 
xlo 5 4|b=| 0 
0 02 =5 


2 -1.0 0 1 0 0 0 
6 =4 5 =3 3 1 0 0 
5.A= = 

8&8 —4 1 0 4 0 1 0 
4 -1 0 7. 2 =1 > 1 

2 =] 0 0 1 

a 2 
x , b= 

0 0 1 0 2 

0 0 0 4 1 

1 4 3 0 1 0 0 0 
=2. => =] 2 =2 1 0 0 
6 A= = 
3 6 -3 —4 3 =2 1 0 

=3 =$ 9 9 =5 4 -2 1 

1 4 30 1 

0 3 2 3 
x , b= 

0 0 -2 0 =i 

0 0 o 1 0 


En los ejercicios 7-12, encuentre una factorización LU de la 


matt IZ dada. 
| 
8. 
3 1 


na] 
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1.23 2.2: =1 
9.|4 5 6 10.4 0 4 
8 7 9 3 4 4 


11. 
0 6 —6 7 
=1 =2 =9 0 
2 2 2 1 
=2 4 =1 2 
12. 
4 4 3 
6 9 8 


Generalice la definición de factorización LU a matrices no 
cuadradas al simplemente requerir que U sea una matriz en 
forma escalonada por renglones. Con esta modificación, en- 
cuentre una factorización LU de las matrices en los ejercicios 
13y 14. 


0 
13.0 3 

0 
14. 


Para una matriz invertible con una factorización LU, A = LU, 
L y U serán invertibles y A”? = UT!L”*. En los ejercicios 15 y 
16, encuentre L”*, U”* y A”? para la matriz dada. 


15. A en el ejercicio 1 16. A en el ejercicio 4 


El inverso de una matriz también se puede calcular al resolver 
varios sistemas de ecuaciones usando el método del ejemplo 
3.34. Para una matriz A de n X n, para encontrar su inverso 
es necesario resolver AX = I, para la matriz X de n X n. Al 
escribir esta ecuación como A[X, Xx, X,] =|[e, e, £,), 
y usar la forma matriz-columna de AX, se ve que es necesario 
resolver n sistemas de ecuaciones lineales. Ax, = €,, AX, 

= ê»... AX, = €, , Más aún, puede usar la factorización 
A = LU para resolver cada uno de dichos sistemas. 


En los ejercicios 17 y 18, use el enfoque recién destacado para 
encontrar A™' para la matriz dada. Compare con el método 
de los ejercicios 15 y 16. 


17. A en el ejercicio 1 18. A en el ejercicio 4 


En los ejercicios 19-22, escriba la matriz permutación dada 
como un producto de matrices elementales (intercambio de 
renglón). 


0 0 0 1 
0 0 1 

0 0 1 0 
19|1 0 0 20. 

01.00 
0 0 

1 0 0 0 

00 100 
0 1100 

1 0 0 0 0 
0 0 0 1 
21. 22.|0 0 0 1 0 
10.00 

0 0 0 0 1I 
0 0 1 0 

01000 


En los ejercicios 23-25, encuentre una factorización P” LU de la 
matriz A dada. 


0 0 1 2 
0 1 4 
=] 1 3 2 
23. 4=|=1 2 1 24. A = 
0 2 1 1 
L3 
11 -1 0 
0 =l 1 3 
= 1 l 2 
25.4 = 
0 L =1 1 
0 0 1 1 


26. Demuestre que existen exactamente n! matrices permu- 
tación den X n. 


En los ejercicios 27-28, resuelva el sistema Ax = b usando la 
factorización dada A = P" LU. Puesto que PP" = I, P'LUx = 
b puede reescribirse como LUx = Pb. Entonces este sistema 
puede resolverse con el método del ejemplo 3.34. 


0 1 -1 o ı olı 00 
27.A=|2 3 2|=|1 0 0|0 1 0 
1 1 -1 o 0 1JL3 -3 1 
2.3 2 1 
x|0 1 -1|=PLU,b=|1 
0.0 — 5 
8 3 5 o 1 olı 00 
,A=|4 1 2|=|0 o ılı 10 
4 0 3 1 0 0JL2 -1 1 
4 1 2 16 
x|0 -1 1|=PLU,b=|-4 
0 02 4 
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29. Demuestre que un producto de matrices triangulares diagonal). En los ejercicios 31 y 32, encuentre una factoriza- 
inferiores unitarias es triangular inferior unitaria. ción LDU de A. 

30. Demuestre que toda matriz triangular inferior unitaria 31. A en el ejercicio 1 32. A en el ejercicio 4 
es invertible y que su inversa también es triangular infe- 33, Si A es simétrica e invertible y tiene una factorización 


rior unitaria. 


LDU, demuestre que U = L". 


34. Si A es simétrica e invertible, y A = LDL” (con L trian- 


Una factorización LDU de una matriz cuadrada A es una gular inferior unitaria y D diagonal), demuestre que esta 
factorización A = LDU, donde L es una matriz triangular in- factorización es única. Esto es: demuestre que, si tam- 
ferior unitaria, D es una matriz diagonal y U es una matriz bién se tiene A = L,D,L (con L, triangular inferior 
triangular superior unitaria (triangular superior con 1 en su unitaria y D, diagonal), entonces L = L, y D = D4. 


Figura 3.2 


S b |] b di iÓ k 
unespacios, NaASesS, UIMeEnsSIOnN Y ran 


Esta sección presenta tal vez las ideas más importantes de todo el libro. Ya se vio que 
existe una interacción entre geometría y álgebra: con frecuencia es posible usar intuición 
geométrica y razonar para obtener resultados algebraicos, y la potencia del álgebra con 
frecuencia permitirá extender los hallazgos más allá de los escenarios geométricos en los 
que surgieron por primera vez. 

En el estudio de los vectores ya encontró informalmente todos los conceptos en esta 
sección. Aquí, comenzará a volverse más formal al proporcionar definiciones para las 
ideas clave. Como verá, la noción de subespacio es simplemente una generalización alge- 
braica de los ejemplos geométricos de rectas y planos que pasan por el origen. El con- 
cepto fundamental de base para un subespacio se deriva entonces de la idea de vectores 
directores para tales rectas y planos. El concepto de base le permitirá dar una definición 
precisa de dimensión que concuerde con una idea geométrica intuitiva del término, aun- 
que es suficientemente flexible para permitir la generalización a otros escenarios. 

También comenzará a ver que dichas ideas arrojan más luz a lo que ya sabe acerca de 
las matrices y la solución de sistemas de ecuaciones lineales. En el capítulo 6 encontrará 
nuevamente todas estas ideas fundamentales con más detalle. Considere esta sección 
como una sesión de “familiarización”. 

Un plano que pasa por el origen en R? “parece” una copia de R°. Intuitivamente, esta- 
ría de acuerdo en que ambos son “bidimensionales”. Si presiona un poco, también puede 
decir que cualquier cálculo que pueda hacerse con vectores en R? también puede reali- 
zarse en un plano que pasa por el origen. En particular, puede sumar y tomar múltiplos 
escalares (y, más generalmente, formar combinaciones lineales) de vectores en tal plano, 
y los resultados son otros vectores en el mismo plano. Se dice que, como R?, un plano que 
pasa por el origen es cerrado con respecto a las operaciones de suma y multiplicación es- 
calar. (Vea la figura 3.2.) 

Pero los vectores en este plano, ¿son objetos bidimensionales o tridimensionales? 
Puede argumentar que son tridimensionales porque existen en R? y por tanto tienen tres 
componentes. Por otra parte, pueden describirse como una combinación lineal de sólo 
dos vectores, vectores dirección para el plano, y por tanto son objetos bidimensionales 
que existen en un plano bidimensional. La noción de subespacio es la clave para resolver 
este rompecabezas. 
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Definición Un subespacio de R” es cualquier colección S de vectores en R” tal 
que: 


1. El vector cero 0 está en S. 

2. Si u y v están en S, entonces u + v está en S. (S es cerrado bajo la suma.) 

3. Si u está en S y c es un escalar, entonces cu está en S. (S es cerrado bajo la multi- 
plicación por un escalar.) 


También podría combinar las propiedades (2) y (3) y requerir, de manera equivalente, 
que S sea cerrado bajo combinaciones lineales: 


Si u}, U, ..., U están en SY Cy, ©» . . ., C¿ Son escalares, 


entonces cu; + U, + +: + cu están en S. 


Ejemplo 3.37 Toda recta y plano a través del origen en R? es un subespacio de R°. Debe ser claro geo- 
métricamente que se satisfacen las propiedades (1) a (3). He aquí una denostración al- 
gebraica en el caso de un plano a través del origen. En el ejercicio 9 se le pide dar la 
demostración correspondiente para una recta. 

Sea P un plano a través del origen con vectores directores v, y v,. Por tanto, P = 
gen (v,,v>). El vector cero 0 está en P, pues 0 = 0v, + Ov,. Ahora sean 


u= cv tov y v= dv, + dav, 
dos vectores en P. Entonces 
u +v = (cv, + ov) + (dv, + dv) = (à + d,)v, + (o + d,)v, 


Por tanto, u + v es una combinación lineal de v, y v,,y por tanto está en P. 
Ahora sea c un escalar. Entonces 


cu = clc¡v, + ov) = ([cc,)v, + (cc,)v, 


que muestra que cu también es una combinación lineal de v; y v, y por tanto está en P. 
Se demostró que Y satisface las propiedades (1) a (3) y en consecuencia es un subespa- 


cio de R’. | 


Si observa cuidadosamente los detalles del ejemplo 3.37, notará que el hecho de que 
v, y V, fueran vectores en R? no tuvo papel alguno en la verificación de las propiedades. 
En consecuencia, el método algebraico utilizado debe generalizarse más allá de R? y apli- 
carse en situaciones donde ya no se pueda visualizar la geometría. Lo hace. Más aún, el 
método del ejemplo 3.37 puede servir como “plantilla” en escenarios más generales. 
Cuando el ejemplo 3.37 se generaliza al generador de un conjunto arbitrario de vectores 
en cualquier R”, el resultado es suficientemente importante como para llamarse teo- 
rema. 


Teorema 3.19 Sean y, v,,..., v, vectores en R". Entonces gen(v,, v,, . .., V) es un subespacio de R”. 


Demostración Sea S = gen(v,, V» ... . , V¿). Para demostrar la propiedad (1) de la defi- 
nición, simplemente se observa que el vector cero 0 está en S, ya que 0 = Ov, + 0v, + ++ 
+ Ov;. 
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Ahora sean 
u= cov tev teet eN y v= dw + dy, ++ dv, 


dos vectores en S. Entonces 


u +v = (cv; + eov + + cw) + (dv, + dav, + o: + dow) 
= (c + di)vi + (0, + di)va + + (0 + dy) Vy 
Por tanto, u + v es una combinación lineal de v,, v,, . . . , V, y por tanto está en S. Esto ve- 


rifica la propiedad (2). 
Para demostrar la propiedad (3), sea c un escalar. Entonces 


cu = c(c;v, + OV + “co + cwe) 
= (cc,)v, + (cc,)w, + > + (ccp)vk 


lo que demuestra que cu también es una combinación lineal de v}, v}, . . . , V, y por tanto 

está en S. Se demostró que S satisface las propiedades (1) a (3) y en consecuencia es un 

subespacio de R”. | 

A gen(v,, V» . . -> V) se le llamará subespacio generado por v,, V», . . . , V Con fre- 

cuencia podrá ahorrar mucho trabajo al reconocer cuándo puede aplicarse el Teorema 
3.19. 

| le 


Demuestre que el conjunto de todos los vectores | y | que satisfacen las condiciones 


x= 3y y z = —2y forman un subespacio de R°. 


Solución La sustitución de las dos condiciones en | y | produce 


z 
3y 3 
y|=y 1 
-2y =2 
3 
Dado que y es arbitrario, el conjunto dado de vectores es gen 1 | | y por ende es un 
=2 
subespacio de [R*, por el Teorema 3.19. i 


Geométricamente, el conjunto de vectores del ejemplo 3.38 representa la recta que 
3 


pasa por el origen en R*, con vector director | 1 
-2 
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> 
x 


Determine si el conjunto de todos los vectores | y | que satisface las condiciones x = 3y 
; z 
+ 1yz= —2y es un subespacio de R’. 


Solución Esta vez se tienen todos los vectores de la forma 


3y +1 
y 
-2y 
3y+1 0 
El vector cero no es de esta forma. (¿Por qué no? Trate de resolver y =|0],) 
-2y 0 


Por tanto, la propiedad (1) no se cumple, de modo que este conjunto no puede ser un 


subespacio de R’. 


Ejemplo 3.40 


> 


y e E xX í 
Determine si el conjunto de todos los vectores | | donde y = x, es un subespacio 
de R?. y 


iż x ; 
Solución Se trata de los vectores de la forma | llame S a este conjunto. Esta vez 
x 


0= H pertenece a S (tome x = 0), de modo que se cumple la propiedad (1). Sea 


Xy X 
u=| ,|yv=| 5|enS. Entonces 


X2 


que, en general, no está en S, pues no tiene la forma correcta; esto es: x? +13 + (x, + 
x,)?. Para ser específico, busque un contraejemplo. Si 


Jr E 


3 
entonces tanto u como v están en S, pero su suma u + v = H no está en S pues 5 #37. 


Por tanto, la propiedad (2) falla y S no es un subespacio de R?. | 


Comentario Para que un conjunto S sea un subespacio de algún R”, debe demostrar 
que las propiedades (1) a (3) se sustentan en general. Sin embargo, para que S falle en ser 
subespacio de R”, es suficiente demostrar que no se cumple una de las tres propiedades. 
La ruta más sencilla por lo general es encontrar un solo contraejemplo específico para 
ilustrar la falla de la propiedad. Una vez hecho esto, no hay necesidad de considerar las 
otras propiedades. 


En el contexto de las matrices surgen una gran cantidad de ejemplos de subespacios. Ya 
se encontraron las más importantes en el capítulo 2; ahora se revisarán nuevamente con 
la noción de subespacio en mente. 
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Definición Sea A una matriz dem X n. 


1. El espacio renglón de A es el subespacio renglón(A) de R” generado por los ren- 
glones de A. 

2. El espacio columna de A es el subespacio col(4) de R” generado por las colum- 
nas de A. 


Ejemplo 3.41 


»—> 


Considere la matriz 


I. =l1 
A=|0 1 
-3 
1 
(a) Determine sib = | 2 | está en el espacio columna de A. 
3 


(b) Determine siw = [4 5] está en el espacio renglón de A. 
(c) Describa renglón(A) y col(4). 


Solución 

(a) Por el Teorema 2.4 y el análisis que le precedió, b es una combinación lineal de las 
columnas de A si y sólo si el sistema lineal Ax = b es consistente. La matriz aumentada 
se reduce por renglones del modo siguiente: 


1 —1|1 1 0/3 
0 1|2 | —> |0 1/2 
s E 0 0j0 


Por tanto, el sistema es consistente (y, de hecho, tiene una solución única). Por tanto, b 
está en col(A). (De hecho este ejemplo es el 2.18, parafraseado en la terminología de esta 
sección.) 

(b) Como también se vio en la sección 2.3, las operaciones elementales con renglones 
simplemente crean combinaciones lineales de los renglones de una matriz. Esto es, pro- 
ducen vectores solamente en el espacio renglón de la matriz. Si el vector w está en ren- 
glón(A), entonces w es una combinación lineal de los renglones de A, de modo que si A 


A : ; , 
se aumenta con w como | , será posible aplicar operaciones elementales con renglo- 
w 


$ 


nes a esta matriz aumentada para reducirla a la forma ES usando solamente operacio- 


nes elementales con renglones de la forma R; + kR;, donde i > j; en otras palabras, tra- 
bajar de arriba abajo en cada columna. (¿Por qué?) 
En este ejemplo se tiene 


ll =1 R;—3R; 1 —1 1 —1 

| A | 0 1 R¿AR, 0 1 R¿—9R, 0 1 
Ao EE 

3 :=3 0 0 0 0 

4 5 0 9 0 0 
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Por tanto, w es una combinación lineal de los renglones de A (de hecho, estos cálculos 
muestran que w = 4[1 —1] +90 1]; ¿cómo?), y por tanto w está en renglón(A). 


(c) Es fácil comprobar que, para cualquier vector w = [x y], la matriz aumentada 


A 
E se reduce a 


w 


en forma similar. Por tanto, todo vector en R? está en renglón(A), y en consecuencia ren- 
glón (A) = R’. 

Encontrar col(A) es idéntico a resolver el ejemplo 2.21, en que se determinó que 
coincide con el plano (a través del origen) en R? con ecuación 3x — z = 0. (Dentro de 
poco se descubrirán otras formas de responder este tipo de preguntas.) A 


Comentario También podría responder el inciso (b) y la primera parte del inciso (c) 
al observar que cualquier pregunta acerca de los renglones de A es la correspondiente 
pregunta acerca de las columnas de A”. De este modo, por ejemplo w está en renglón(A) 
si y sólo si w” está en col(A?). Esto es verdadero si y sólo si el sistema Ax = w” es con- 
sistente. Ahora puede proceder como en el inciso (a). (Vea los ejercicios 21-24.) 


Los comentarios hechos acerca de la relación entre operaciones elementales con ren- 
glones y el espacio renglón se resumen en el siguiente teorema. 


Teorema 3.20 


Sea B cualquier matriz que es equivalente por renglones a una matriz A. Entonces 
renglón(B) = renglón(A). 


Demostración La matriz A puede transformarse en B mediante una secuencia de ope- 
raciones con renglones. En consecuencia, los renglones de B son combinaciones lineales 
de los renglones de A; por tanto, las combinaciones lineales de los renglones de B son 
combinaciones lineales de los renglones de A. (Vea el ejercicio 21 en la sección 2.3.) Se 
tiene que renglón(B) C renglón(A). 

Por otra parte, invertir dichas operaciones con renglones transforman B en A. Por 
tanto, el argumento anterior demuestra que renglón(A) C renglón(B). Combinando 
estos resultados renglón(A) = renglón(B) —— A 


Existe otro importante subespacio que ya se encontró: el conjunto de soluciones de 
un sistema homogéneo de ecuaciones lineales. Es fácil probar que este subespacio satis- 
face las tres propiedades de los subespacios. 


Teorema 3.21 


Sea A una matriz de m X n y sea N el conjunto de soluciones del sistema lineal ho- 
mogéneo Ax = 0. Entonces N es un subespacio de R”. 


Demostración [Note que x debe ser un vector (columna) en R” para que Ax esté defi- 
nido y que 0 = 0, es el vector cero en R”.] Dado que A0, = 0,,, 0, está en N. Ahora sean 
u y ven N. Por tanto, Au = 0 y Av = 0. Se tiene que 


m 


A(u + v) = Au + Av=0+0=0 
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En consecuencia, u + v está en N. Finalmente, para cualquier escalar c, 
A(cu) = c(Au) = c0 = 0 


y en consecuencia cu también está en N. Se tiene que N es un subespacio de R”. 


Definición Sea A una matriz de m X n. El espacio nulo de A es el subespacio de 
R” que consiste de las soluciones del sistema lineal homogéneo Ax = 0. Se denota me- 
diante nul(4). 


El hecho de que el espacio nulo de una matriz sea un subespacio permite probar lo 
que la intuición y los ejemplos condujeron a entender acerca de las soluciones de los sis- 
temas lineales: no tienen solución, tienen una solución única o un número infinito de 
soluciones. 


Teorema 3.22 


Sea A una matriz cuyas entradas son números reales. Para cualquier sistema de ecua- 
ciones lineales Ax = b, exactamente uno de los siguientes es verdadero: 


a. No hay solución. 
b. Hay una solución única. 
c. Hay un número infinito de soluciones. 


A primera vista, no es completamente claro cómo se debe proceder para probar este 
teorema. Un poco de reflexión debe persuadirlo de que lo que realmente se pide probar 
es que si (a) y (b) no son verdaderas, entonces (c) es la única posibilidad. Esto es, si hay 
más de una solución, entonces no puede haber sólo dos o incluso muchas en una canti- 
dad finita, sino que debe haber un número infinito. 


Demostración Siel sistema Ax = b no tiene solución o tiene exactamente una solución, 
está demostrado. Suponga, entonces, que existen al menos dos soluciones distintas de Ax 
= b, por ejemplo x; y x,. Por tanto, 


Ax =b Y Ax=b 
con x, %x,. Se tiene que 


A(x, — Xx) = Ax, Ax =b-b=0 


Sea X, = X, — X,. Entonces x, %0 y Ax, = 0. En consecuencia, el espacio nulo de A es no tri- 
vial, y dado que nul(A) es cerrado para la multiplicación por un escalar, cx, está en nul(A) 
para todo escalar c. En consecuencia, el espacio nulo de A contiene infinitos vectores (dado 
que contiene al menos a todo vector de la forma cx, y existen infinitos de ellos.) 

Ahora, considere los vectores (un número infinito) de la forma x, + cX, cuando c varía 
a lo largo del conjunto de los números reales. Se tiene 


A(X, + CXp) = Ax, + cAx%x =b+c0=b 


Por tanto, existe un número infinito de soluciones de la ecuación Ax =b. —_— =E 


Es posible extraer un poco más de la idea intuitiva de que los subespacios son generali- 
zaciones de planos a través del origen en R°. Un plano se genera mediante cualesquiera 
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dos vectores que son paralelos al plano pero no son paralelos entre ellos. En lenguaje al- 
gebraico, dos de tales vectores generan el plano y son linealmente independientes. 
Menos de dos vectores no funcionarán; más de dos vectores no son necesarios. Esta es 
la esencia de una base para un subespacio. 


Definición Una base para un subespacio S de R” es un conjunto de vectores en 
S que 


1. genera S y 
2. es linealmente independiente. 


Ejemplo 3.42 


ze 
En la sección 2.3 se vio que los vectores unitarios estándar e,, €, .. . e, en R” son lineal- 
mente independientes y generan R”. Por tanto, forman una base para R”, lamada base 


estándar. | 


Ejemplo 3.43 


> 


2| |1 2 1 
En el ejemplo 2.19 se demostró que R? = wen | 2, 3) Dado que E y A 


también son linealmente independientes (ya que no son múltiplos), forman una base 
2 
para R^. | 


Un subespacio puede tener (y tendrá) más de una base. Por ejemplo, recién se vio 


que R? tiene la base estándar j ; j y la base i ] N . Sin embargo, dentro 
0 1 =] 3 


de poco se probará que el número de vectores en una base para un subespacio dado siem- 
pre será el mismo. 


Ejemplo 3.44 


Encuentre una base para S = gen (u, v, w), donde 


3 2 0 
u=|-1/v=|1 y w=|-5 
5 3 1 


Solución Los vectores u, v y w ya generan S, de modo que serán una base de S si tam- 
bién son linealmente independientes. Es fácil determinar que no lo son; de hecho, w = 
2u — 3v. Por tanto, puede ignorarse w, pues cualquier combinación lineal que involucre 
u, v y w puede reescribirse para involucrar sólo a u y v. (Vea también el ejercicio 47 de la 
sección 2.3.) Esto implica que S = gen (u, v, w) = gen (u, v), y dado que u y v cierta- 
mente son linealmente independientes (¿por qué?), forman una base para S. (Geométri- 
camente, esto significa que u, v y w yacen todos en el mismo plano, y u y v pueden ser- 
vir como un conjunto de vectores directores para este plano.) e; 
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Ejemplo 3.45 


Encuentre una base para el espacio renglón de 
1 I 3 1 6 


2 =] 0 I sI 

A= 
=3 2 1 =2 1 
4 1 6 1 3 


Solución La forma escalonada reducida por renglones de A es 


LOO L0 =l 

0120 3 
R= 

0 0 0 1 4 

0000 0 


Por el Teorema 3.20, renglón(A) = renglón(R), de modo que es suficiente encontrar una 
base para el espacio renglón de R. Pero renglón(R) claramente es generado por sus ren- 
glones distintos de cero, y es fácil comprobar que el patrón en escalera fuerza a los pri- 
meros tres renglones de R a ser linealmente independientes. (Este es un hecho general, 
que necesitará establecer para probar el ejercicio 33.) En consecuencia, una base para el 
espacio renglón de A es 


[1 0 1 0 -1][0 1 2 0 3], [0 0 0 1 4} 4 


Puede usar el método del ejemplo 3.45 para encontrar una base para el subespacio 
generado por un conjunto dado de vectores. 


Ejemplo 3.46 


Vuelva a trabajar el ejemplo 3.44 usando el método del ejemplo 3.45. 


Solución Transponga u, v y w para obtener vectores renglón y luego formar una matriz 
con dichos vectores como sus renglones: 


5 =l 3 
B=|2 1.3 
0 => 1 


Al proceder como en el ejemplo 3.45, se reduce B a su forma escalonada reducida por 
renglones 


10 ¿ 
0 1 — 
00 0 


y use los vectores renglón distintos de cero como base para el espacio renglón. Dado que 
comenzó con vectores columna, debe transponer nuevamente. Por tanto, una base para 
gen(u, v, w) es 


-+ 


+ De hecho, no es necesario llegar a la forma escalonada reducida por renglones, la 
forma escalonada es suficiente. Si U es una forma escalonada por renglones de A, en- 
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tonces los vectores renglón distintos de cero de U formarán una base para renglón(A) 
(vea el ejercicio 33). Este planteamiento tiene la ventaja de (con frecuencia) permitir evi- 
tar las fracciones. En el ejemplo 3.46, B puede reducirse a 


3 =L 5 
U=|0 -5 1 
0. 0.0 
que produce la base 
3 0 
=1 1,1 =5 
5 1 


para gen (u, v, w). 
+  Advierta que los métodos usados en el ejemplo 3.44, el ejemplo 3.46 y el comen- 
tario anterior por lo general producirán diferentes bases. 


Ahora se regresa al problema de encontrar una base para el espacio columna de una 
matriz A. Un método es simplemente transponer la matriz. Los vectores columna de A 
se convierten en los vectores renglón de A” y puede aplicar el método del ejemplo 3.45 
para encontrar una base para renglón(A”). Al transponer estos vectores se produce una 
base para col(A). (En los ejercicios 21-24 se le pide hacer esto.) Sin embargo, este es- 
quema requiere realizar un nuevo conjunto de operaciones de renglón sobre A”. 

En vez de ello, es preferible un planteamiento que permita usar la forma reducida 
por renglones de A que ya se calculó. Recuerde que un producto de Ax de una matriz y 
un vector corresponde a una combinación lineal de las columnas de A con las entradas 
de x como coeficientes. Por tanto, una solución no trivial a Ax = 0 representa una rela- 
ción de dependencia entre las columnas de A. dado que las operaciones elementales con 
renglones no afectan al conjunto solución, si A es equivalente por renglones a R, las co- 
lumnas de A tienen las mismas relaciones de dependencia que las columnas de R. Esta im- 
portante observación es el fundamento de la técnica que ahora se usa para encontrar una 
base para col(A). 


Ejemplo 3.47 


Encuentre una base para el espacio columna de la matriz del ejemplo 3.45, 
1 E -3 1 6 
2 =1 0 ll 
=3 2 1 =2 1 
4 1 6 1 3 


Solución Sea a, un vector columna de A y r; un vector columna de la forma escalonada 


reducida 
101.0 —1 
0.1.2.0 3 
R= 
0 0 0 1 4 
0000 0 
Puede ver rápidamente por inspección que r, = r, + 2r, y r; = —r, + 3r, + 4r,. (Com- 


pruebe que, como se predijo, los correspondientes vectores columna de A satisfacen las 
mismas relaciones de dependencia.) Por tanto, r, y r, no contribuyen a col(R). Los vec- 
tores columna restantes, r,, r, y r,, son linealmente independientes, pues son vectores 
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unitarios estándar. En consecuencia, los enunciados correspondientes son verdaderos 
para los vectores columna de A. 

Por tanto, entre los vectores columna de A, se eliminan los dependientes (a, y as), y 
los restantes serán linealmente independientes y en consecuencia forman una base para 
col(A). ¿Cuál es la forma más rápida de encontrar esta base? Use las columnas de A que 
correspondan a las columnas de R que contengan los 1 pivote. Una base para col(A) es 


1 1 1 
2 =l 1 
a; d, ayj = > > 
(a, a, as) =3 2 zj 
4 


E 4 


Advertencia ¡Las operaciones elementales con renglones cambian el espacio co- 
lumna! En el ejemplo, col(4) Fcol(R), ya que todo vector en col(R) tiene su cuarto com- 
ponente igual a 0, pero esto ciertamente no es verdadero de col(4). De modo que debe 
regresar a la matriz original A para obtener los vectores columna para una base de 
col(A). Para ser específico, en el ejemplo 3.47, r,, r, y r, no forman una base para el es- 
pacio columna de A. 


Ejemplo 3.48 Encuentre una base para el espacio nulo de la matriz A del ejemplo 3.47. 


Solución En realidad no hay nada nuevo aquí, excepto la terminología. Simplemente 
debe encontrar y describir las soluciones del sistema homogéneo Ax = 0. Ya se calculó la 
forma escalonada reducida por renglones R de A, de modo que todo lo que falta por 
hacer en la eliminación de Gauss-Jordan es resolver para las variables pivote en términos 
de las variables libres. La matriz aumentada final es 


1 O 1 0 —1[0 
0120 310 
RI lo o 0.1 alo 
0 0 0 0 0/0 
Si 
X 
X 
x =|% 
X4 
Xs 


entonces los 1 pivote están en las columnas 1, 2 y 4, así que se resuelve para x,, x, y x, en 
términos de las variables libres x, y x;. Se obtiene x, = =x, + x; Xx, = —2x, — 3x; Y X4 
= —4x;,. Al hacer x, = s y x; = t, se obtiene 


X e E =] 1 
Xx» =2 31 =A =3 
x=|x%]|= Ss =s| 1|+t| O|=su=w+ tv 
Xa —4t 0 —4 
Xx; f 0 1 


Por tanto, u y v generan nul(A), y dado que son linealmente independientes, forman una 


base para nul(A). 
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A continuación hay un resumen del procedimiento más efectivo para encontrar 
bases para el espacio renglón, el espacio columna y el espacio nulo de una matriz A. 


1. Encuentre la forma escalonada reducida por renglones R de A. 

2. Use los vectores renglón distintos de cero de R (que contengan los 1 pivote) para 
formar una base para renglón(A). 

3. Use los vectores columna de A que correspondan a las columnas de R que con- 
tengan los 1 pivote (las columnas pivote) para formar una base para col(A). 

4. Resuelva para las variables pivote de Rx = 0 en términos de las variables libres, 
iguale las variables libres a parámetros, sustituya de vuelta en x y escriba el resul- 
tado como una combinación lineal de f vectores (donde f es el número de varia- 
bles libres). Estos vectores f forman una base para nul(A). 


Si no necesita encontrar el espacio nulo, entonces es más rápido simplemente redu- 
cir A a la forma escalonada por renglones para encontrar bases para los espacios renglón 
y columna. Los pasos 2 y 3 anteriores siguen siendo válidos (con la sustitución de la pa- 
labra “pivotes” en vez de “1 pivotes”). 


Ya observó que, aunque un subespacio tendrá diferentes bases, cada una tiene el mismo 
número de vectores. Este hecho fundamental será de vital importancia en este libro a 
partir de ahora. 


Teorema 3.23 


2% 


Sherlock Holmes apuntó: “Cuando 
se ha eliminado lo imposible, 
cualquier cosa que quede, aunque 
sea improbable, debe ser la verdad” 
(de El signo de los cuatro, de sir 
Arthur Conan Doyle). 


El Teorema de la Base 


Sea S un subespacio de R”. Entonces cualesquiera dos bases para S tienen el mismo 
número de vectores. 


Demostración Sean B = (u,,u,,..., u,} y C = {Vi v,..., v,) bases de S. Necesita de- 
mostrar que r = s. Esto se hace al demostrar que no puede ocurrir ninguna de las otras 
dos posibilidades, r < s o r > s. 

Suponga que r < s. Se demostrará que esto fuerza a C a ser un conjunto linealmente 
dependiente de vectores. Para este fin, sea 


CGV E V tee + cev = 0 (1) 


Dado que B es una base para S, puede escribir cada v; como una combinación lineal de 
los elementos u; 


Vi = 4,4, + 4,70), ++: 0,0, 


V = 474, + 48) + *:: + 0,0, 


(2) 


Vs 


E CAUS Ale 4,4) PRE as 4, 
Al sustituir las ecuaciones (2) en la ecuación (1) se obtiene 


clani + +0) + (aga, + +00) +++ 04, += +01) =0 
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Al reagrupar se tiene 
(cian + Can + "+ Gag) + (Can + an + *** + c,0,,)u, 
aarep (ca, T Clar Tion C.As,)u, a 0 


Ahora, dado que B es una base, los términos u; son linealmente independientes. De 
modo que cada una de las expresiones entre paréntesis debe ser cero: 


Cay + Ga Fr +t cag =O 
0 


Cl + Gan +` E Cap 


Ciâir + Caa t F Cag = 0 


Este es un sistema homogéneo de r ecuaciones lineales con las s variables c}, C,, . . . , c, (El 
hecho de que las variables aparezcan a la izquierda de los coeficientes no hace diferen- 
cia.) Dado que r < s, se sabe del Teorema 2.3 que existe un número infinito de solucio- 
nes. En particular, existe una solución no trivial, lo que da una relación de dependencia 
no trivial en la ecuación (1). Por tanto, C es un conjunto linealmente dependiente de vec- 
tores. Pero este hallazgo contradice el hecho de que C fue dado como base y en conse- 
cuencia es linealmente independiente. Se concluye que r < s no es posible. De igual 
modo (al intercambiar los roles de B y C), se descubre que r > s conduce a una contra- 
dicción. Por tanto, debe tener r = s, como se deseaba. m 


Dado que todas las bases para un subespacio dado deben tener el mismo número de 
vectores, puede darse un nombre a este número. 


Definición Si S es un subespacio de R”, entonces el número de vectores en una 
base para S se llama la dimensión de S, y se denota dim S. 


»—> Comentario El vector cero 0 por sí mismo siempre es un subespacio de R”. (¿Por 
qué?) Sin embargo, cualquier conjunto que contenga el vector cero (y, en particular, (0)) 
es linealmente dependiente, de modo que {0} no puede tener una base. Se define (0) 
como 0. 


> 
Ejemplo 3.49 Dado que la base estándar para R” tiene n vectores, R” = n. (Note que este resultado 
concuerda con la comprensión intuitiva de dimensión para n £ 3.) 


<+ 


> 
Ejemplo 3.50 En los ejemplos 3.45 a 3.48, se descubrió que renglón(A) tiene una base con tres vecto- 


res, col(A) tiene una base con tres vectores y nul(A) tiene una base con dos vectores. En 
consecuencia, (renglón(A)) = 3, dim (col(4)) = 3 y dim (nul(4)) = 2. 


' ME 
Un solo ejemplo no es suficiente para especular, pero el hecho de que los espacios 
renglón y columna del ejemplo 3.50 tengan la misma dimensión no es accidente. Como 


tampoco lo es el hecho de que la suma de dim(col(A)) y dim(nul(A)) es 5, el número de 
columnas de A. Ahora se probará que estas relaciones son verdaderas en general. 
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Teorema 3.24 


El rango de una matriz la definió 
por primera vez, en 1878, Georg 
Frobenius (1849-1917), aunque él 
la definió usando determinantes y 
no como se hace aquí. (Vea el capí- 
tulo 4.) Frobenius fue un 
matemático alemán que recibió su 
doctorado en la Universidad de 
Berlín, donde más tarde dio clases. 
Mejor conocido por sus aporta- 
ciones a la teoría de grupos, Frobe- 
nius usó matrices en su trabajo 
con representaciones de grupo. 


Los espacios renglón y columna de una matriz A tienen la misma dimensión. 


Demostración Sea R la forma escalonada reducida por renglones de A. Por el Teorema 
3.20, renglón(A4) = renglón(R), de modo que 


dim(renglón(A)) = dim(renglón(R)) 
número de renglones de R distintos de cero 
= número de 1 pivote de R 


Llame a este número r. 

Ahora col(A) Fcol(R), pero las columnas de A y R tienen las mismas relaciones de 
dependencia. Por tanto, dim (col(4)) = dim (col(R)). Dado que existen r 1 pivotes, R 
tiene r columnas que son vectores unitarios estándar, e}, €, . . . , €, (Éstos serán vectores 
en R” si A y R son matrices de m X n.) Esos r vectores son linealmente independientes y 
las columnas restantes de R son combinaciones lineales de ellos. Por tanto, dim (col(R)) 


= r. Se tiene que dim (renglón(A)) = r = dim (col(A)), como se quería demostrar. 
— 


Definición El rank de una matriz A es la dimensión de sus espacios renglón y 
columna y se denota mediante rango(A). 


Por tanto, para el ejemplo 3.50, puede escribir rango(A) = 3. 


Comentarios 

+ La definición anterior concuerda con la definición más informal de rank que se 
dio en el capítulo 2. La ventaja de la nueva definición es que es mucho más flexible. 

e El rank de una matriz simultáneamente proporciona información acerca de la 
dependencia lineal entre los vectores renglón de la matriz y entre sus vectores columna. 
En particular, dice el número de renglones y columnas que son linealmente independi- 
entes (¡y este número es el mismo en cada caso!). 


Dado que los vectores renglón de A son los vectores columna de A", el Teorema 3.24 
tiene el siguiente corolario inmediato. 


Teorema 3.25 


Para cualquier matriz A, 


rank(4%) = rank(A) 


Demostración Se tiene 
rank(A”) = dim (col(A?)) 
= dim (renglón(A)) 
rank A — E 


Definición La nulidad de una matriz A es la dimensión de su espacio nulo y se 
denota por nulidad(A). 
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En otras palabras, nulidad(A) es la dimensión del espacio solución de Ax = 0, que es 
igual que el número de variables libres en la solución. Ahora puede regresar al teorema 
del rank (Teorema 2.2) y parafrasearlo en términos de las nuevas definiciones. 


Teorema 3.26 El Teorema del rank 


Si A es una matriz de m X n, entonces 


rank(A) + nulidad(A) = n 


Demostración Sea R la forma escalonada reducida por renglones de A, y suponga que 
rank(A) = r. Entonces R tiene r 1 pivote, de modo que existen r variables pivote y n — r 
variables libres en la solución de Ax = 0. Puesto que dim(nul(A)) = n—r, se tiene 


rank(A) + nulidad(A) = r + (n — r) 


=n 


Con frecuencia, cuando se necesita conocer la nulidad de una matriz, no es necesa- 
rio conocer la solución real de Ax = 0. El teorema del rank es extremadamente útil en 
tales situaciones, como ilustra el siguiente ejemplo. 


Ejemplo 3.51 


Encuentre la nulidad de cada una de las siguientes matrices: 


2 3 

MA 
=g g T 
3 6 

2 TL =i 
N=|4 4 -3 1 
27 1 38 


Solución Dado que las dos columnas de M claramente son linealmente independien- 
tes, rank(M) = 2. Por tanto, por el teorema del rank, nulidad(M) = 2 — rank(M) = 
2-2=0. 

No hay dependencia obvia entre los renglones o columnas de N, así que se aplican 
operaciones con renglones para reducirla a 


2 L =2 =1 
0 2 1 3 
0 0 0 0 


La matriz se redujo lo suficiente (aquí no es necesaria la forma escalonada reducida por 
renglones, pues no se busca una base para el espacio nulo). Se ve que sólo existen dos 
renglones distintos de cero, de modo que rank(N) = 2. En consecuencia, nulidad (N) = 


4 — rank(N) =4-2=2. | 


Los resultados de estas acciones permiten extender el teorema fundamental de las 
matrices invertibles (Teorema 3.12). 
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Teorema 3.27 


La nulidad de una matriz la definió 
en 1884 James Joseph Sylvester 
(1814-1887), quien estaba 
interesado en las invariantes: 
propiedades de las matrices que no 
cambian en ciertos tipos de 
transformaciones. Originario de 
Inglaterra, Sylvester se convirtió en 
el segundo presidente de la Sociedad 
Matemática de Londres. En 1878, 
mientras impartía clases en la Johns 
Hopkins University en Baltimore, 
fundó el American Journal of 
Mathematics, la primera revista 
matemática en Estados Unidos. 


El teorema fundamental de las matrices invertibles: versión 2 


Sea A una matriz de n X n. Los siguientes enunciados son equivalentes: 


. A es invertible. 

Ax = b tiene una solución única para todo b en R”. 

Ax = 0 tiene sólo la solución trivial. 

. La forma escalonada reducida por renglones de A es I,,. 

A es un producto de matrices elementales. 

rank(A) = n 

. nulidad(A) = 0 

. Los vectores columna de A son linealmente independientes. 
Los vectores columna de A generan R”. 

Los vectores columna de A forman una base para R”. 

. Los vectores renglón de A son linealmente independientes. 
Los vectores renglón de A generan R”. 

m. Los vectores renglón de A forman una base para R”. 


A E 


Demostración Ya se estableció la equivalencia desde (a) hasta (e). Falta por demostrar 
que los enunciados (f) al (m) son equivalentes a los primeros cinco enunciados. 


(£) => (g) Dado que rank(A4) + nulidad(A) = n cuando A es una matriz de n X n, se 
tiene del teorema del rank que rank(A) = n si y sólo si nulidad(A) = 0. 

(£) => (d) => (c) > (h) Si rank(4) = n, entonces la forma escalonada reducida por 
renglón de A tiene n 1 pivotes, y por tanto es I„. De (d) = (c) se sabe que Ax = 0 sólo 
tiene la solución trivial, lo que implica que los vectores columna de A son linealmente 
independientes, pues Ax es justo una combinación lineal de los vectores columna de A. 


(h) = (i) Si los vectores columna de A son linealmente independientes, entonces Ax = 
0 sólo tiene la solución trivial. Por tanto, por (c) = (b), Ax = b, tiene una solución única 
para todo b en R”. Esto significa que todo vector b en R” puede escribirse como una 
combinación lineal de los vectores columna de A, lo que establece (i) 


(i) = (j) Si los vectores columna de A generan R”, entonces col(A) = R” por definición, 
de modo que rank(A) = dim(col(A)) = n. Esto es (f), y ya se estableció que (f) => (h). 
Se concluye que los vectores columna de A son linealmente independientes y por tanto 
forman una base para R”, pues, por suposición, también generan R”. 

(j) => (f) Si los vectores columna de A forman una base para R”, entonces, en particular, 
son linealmente independientes. Se tiene que la forma escalonada reducida por ren- 
glones de A contiene n 1 pivotes, y por tanto rank(A) = n. 

El análisis anterior demuestra que (f) > (d) > (c) > (h) > (1) = (j) > (£) = (g). 
Ahora recuerde que, por el Teorema 3.25, rank(A™) = rank(A), de modo que lo recién 
demostrado da los resultados correspondientes acerca de los vectores columna de A”. 
Estos son entonces resultados acerca de los vectores renglón de A, lo que incluye en (k), 
(1) y (m) a la red de equivalencias y completa la demostración. 


Los teoremas como el teorema fundamental no son simplemente de interés teórico. 
También son tremendos dispositivos que ahorran trabajo. El teorema fundamental ya 
permitió recortar a la mitad el trabajo necesario para comprobar que dos matrices cua- 
dradas son inversas. También simplifica la tarea de demostrar que ciertos conjuntos de 
vectores son bases para R”. De hecho, cuando se tiene un conjunto de n vectores en R”, 
dicho conjunto será una base para R” si es verdadera alguna de las propiedades necesa- 
rias de independencia lineal o de conjunto generador. El siguiente ejemplo muestra cuán 
fáciles pueden ser los cálculos. 


Sección 3.5  Subespacios, bases, dimensión y rank 213 


Ejemplo 3.52 


Demuestre que los vectores 


L —1 4 
Pis 0 y 9 
5) 1 7 


forman una base para R’. 


Solución De acuerdo con el Teorema Fundamental, los vectores formarán una base 
para R? si y sólo si una matriz con estos vectores como sus columnas (o renglones) tiene 
rank 3. Se realizan sólo suficientes operaciones con renglones para determinar esto: 


1 -=1 4 1: =I 4 
A=|2 0 9|—>]|0 2 1 
3 1 7 0 0. =7 


Se ve que A tiene rank 3, de modo que los vectores dados son una base para R?, por la 


equivalencia de (f) y (j). 


El siguiente teorema es una aplicación tanto del teorema del rank como del teorema 
fundamental. Este resultado se requerirá en los capítulos 5 y 7. 


Teorema 3.28 


Sea A una matriz de m X n. Entonces: 


a. rank(A7A) = rank(A) 
b. La matriz AA de n X n es invertible si y sólo si rank(A) = n. 


Demostración 
(a) Dado que AA es de n X n, tiene el mismo número de columnas que A. El teorema 
del rank dice entonces que 


rank(A) + nulidad(A) = n = rank(A7A) + nulidad(A*A) 


Por tanto, para demostrar que rank(A) = rank(A*A), es suficiente demostrar que nuli- 
dad(A) = nulidad(A*A). Se hará así al establecer que los espacios nulos de A y ATA son 
iguales. 

Para este fin, sea x en nul(A), de modo que Ax = 0. Entonces ATAx = A70 =0, y por 
tanto x está en nul(A7A). A la inversa, sea x en nul(A7A). Entonces ATAx = 0, de modo 
que x"A”Ax = x"0 = 0. Pero entonces 


(Ax) -(4x) = (4x)(4x) = x"A"Ax = 0 
y en consecuencia Ax = 0, por el Teorema 1.2(d). Por tanto, x está en nul(A), de modo 


que nul(A) = nul(47A), como se requería. 


(b) Por el teorema fundamental, la matriz ATA de n X n es invertible si y sólo si 
rank(A7A) = n. Pero, por (a), esto se cumple si y sólo si rank(A) = n. _— | 


Ahora regrese a una de las preguntas planteadas al comienzo de esta sección: ¿cómo se 
verían los vectores en R? que existen en un plano que pasa por el origen? ¿Son bidimen- 
sionales o tridimensionales? Las nociones de base y dimensión ayudarán a clarificar las 
cosas. 
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Un plano que pasa por el origen es un subespacio bidimensional de R°, con cual- 
quier conjunto de dos vectores dirección que funcionan como base. Los vectores base 
ubican ejes coordenados en el plano-subespacio y a su vez permiten ver el plano como 
una “copia” de R°. Antes de ilustrar este enfoque, se demostrará un teorema que garan- 
tiza que las “coordenadas” surgidas de esta forma son únicas. 


Teorema 3.29 


Sea S un subespacio de R” y sea 5 = {v}, v}, . . . , v,) una base para S. Para todo vector 
v en S, existe exactamente una forma de escribir v como una combinación lineal de 
los vectores base en $: 


v= CV] + CV ++ CV 


Demostración Dado que B es una base, genera a S, de modo que v puede escribirse en 
al menos una forma como combinación lineal de v,, v}, . . . , V}. Sea una de dichas combi- 
naciones lineales 


V= OV t OV + "+ CNW 


Su tarea es demostrar que ésta es la única forma de escribir v como combinación lineal 
de v}, Vz, +. -, V} Para este fin, suponga que también se tiene 


v = dv, + dv, + ` + dwy 
Entonces CVI E OV t e+ Wk = divi + dv + + dW 
Al reordenar (con las propiedades del álgebra vectorial), se obtiene 
(c = di)vi + (0, — da)vz + "+ (ck — dy) Vy = 0 
Dado que B es una base, v,, V» . . ., V¿ son linealmente independientes. Por tanto, 
(¿—4)= (6 d) = = = (4> d) = 0 


En otras palabras, c, = d}, & = d), . . ., C = dẹ y las dos combinaciones lineales en reali- 
dad son iguales. Por ende, existe exactamente una forma de escribir v como una combi- 
nación lineal de los vectores base en $. 


Definición Sea S un subespacio de R" y sea B = [v,, v,, - - ., V} una base para S. 
Sea v un vector en S, y escriba v = c,v, + c,v, +:** + Cv; Entonces ci, C,, ...., C se lla- 
man las coordenadas de v con respecto a B, y el vector columna 


se llama vector coordenada de v con respecto a B. 


Sea € = {e}, e, e,) la base estándar de R°. Encuentre el vector coordenada de 
v=|7 


con respecto a E. 
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Solución Dado que v = 2e, + 7e, + 4e,, 


2 
[v] = | 7 
4 


Debe ser claro que el vector coordenada de todo vector (columna) en R” con res- 
pecto a la base estándar es justo el vector mismo. 


o 

Ejemplo 3.54 3 2 0 
En el ejemplo 3.44 se vio que U=| —1|,v=|[1|, y w= | —5 | son tres vectores 

5 3 1 


en el mismo subespacio (plano que pasa por el origen) S de R° y que B = {u, v} es una 
base para S. Dado que w = 2u — 3v, se tiene 


Vea la figura 3.3. 


io = [3] 


Las coordenadas de un vector con 


respecto a una base 


> 


i |Hercieios 3.5 


x 
En los ejercicios 1-4, sea S la colección de vectores | | en R? que 
y 


satisfacen la propiedad dada. En cada caso, demuestre que S 
forma un subespacio de R? u ofrezca un contraejemplo para 
demostrar que no lo hace. 
1.x=0 
3y = 2x 4. xy = 0 


En los ejercicios 5-8, sea S la colección de vectores y | en R? 
z 

que satisfacen la propiedad dada. En cada caso, demuestre que 

S forma un subespacio de R? u ofrezca un contraejemplo para 

demostrar que no lo hace. 


5x5 y=z 6.2=2xy=0 


8. (x= y| = ly = z| 
9. Demuestre que toda recta que pasa por el origen en R? 
es un subespacio de R°. 


7.x=y+z=1 


10. Suponga que S consiste de todos los puntos en R? que 
están sobre el eje x o el eje y (o ambos). (S se llama la 
unión de los dos ejes.) ¿S es un subespacio de R? ¿Por 
qué sí o por qué no? 


En los ejercicios 11 y 12, determine si b está en col(A) y si w 
está en renglón(A), como en el ejemplo 3.41. 


m.a=|; . lo 3 a 1 1] 


1 1 1 


1 1 -1 1 
2.A=|1 3 O|b=|2|w=[1 -3 -3] 
3 -1 -5 1 
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13. En el ejercicio 11, determine si w está en renglón(A), 
usando el método descrito en el comentario que sigue al 
ejemplo 3.41. 

14. En el ejercicio 12, determine si w está en renglón(A), 
usando el método descrito en el comentario que sigue al 
ejemplo 3.41. 


=] 

15. Si A es la matriz del ejercicio 11, ¿v = 3 | está en 
nul(A)? = 
7 

16. Si A es la matriz del ejercicio 12, ¿v = | —1 | está en 
nul(A)? 2 


En los ejercicios 17-20, proporcione bases para renglón(A), 
col(A) y nul(A). 


1 1 —1 
T O = 
ma=| | 18.4=]|1 5 1 
1 1 
I =1 =2 
1 1 0 1 
19 A=|0 1 —1 1 
0 I =p =l 
2 —4 0 2 1 
20.A = | —1 2.1.2 3 
l1 -2 1 4 4 


En los ejercicios 21-24, encuentre bases para renglón(A) y 
col(A) en los ejercicios dados usando A”. 


21. Ejercicio 17 22. Ejercicio 18 
23. Ejercicio 19 24. Ejercicio 20 
25. Explique cuidadosamente por qué sus respuestas a los 


ejercicios 17 y 21 son ambas correctas, aun cuando pa- 
rezca haber diferencias. 

26. Explique cuidadosamente por qué sus respuestas a los 
ejercicios 18 y 22 son ambas correctas, aun cuando pa- 
rezca haber diferencias. 


En los ejercicios 27-30, encuentre una base para el generador de 
los vectores dados. 


1] P-1 0 1] [2] Po 
27.| -1l obl 1f 28 de li rl 
0 1] L-1 1j Lo] Lı 
29.[2 -3 1),[1 -1 0ļ},[4 -4 1] 
30.[3 1 -1 0)[0 -1 2 -1)[4 3 8 3] 


Para los ejercicios 31 y 32, encuentre bases para los generado- 
res de los vectores en los ejercicios dados de entre los vectores 
mismos. 


31. Ejercicio 29 32. Ejercicio 30 


33. Demuestre que si R es una matriz en forma escalonada, 
entonces una base para renglón(R) consiste de los ren- 
glones distintos de cero de R. 


34. Demuestre que si las columnas de A son linealmente in- 
dependientes, entonces deben formar una base para 
col(4). 


Para los ejercicios 35-38, proporcione el rank y la nulidad de las 
matrices en los ejercicios dados. 


35. Ejercicio 17 
36. Ejercicio 18 
37. Ejercicio 19 
38. Ejercicio 20 


39. Si A es una matriz de 3 X 5, explique por qué las colum- 
nas de A deben ser linealmente dependientes. 

40. Si A es una matriz de 4 X 2, explique por qué los ren- 
glones de A deben ser linealmente dependientes. 

41. Si A es una matriz de 3 X 5, ¿cuáles son los posibles va- 
lores de nulidad(A)? 


42. Si A es una matriz de 4 X 2, ¿cuáles son los posibles va- 
lores de nulidad(4)? 


En los ejercicios 43 y 44, encuentre todos los posibles valores de 
rank(A) cuando a varía. 


1 2 a a 27 el 
43.A=|-2 4a 2 44. A = 3 3 -2 
a -—2 1 =2 -—1 a 


Responda los ejercicios 45-48 al considerar la matriz con los 
vectores dados como sus columnas. 


1 1 0 
45.5|1|,|0|,| 1 | forma una base para R°? 
0 1 1 
1 =2 1 
46.;| —1 l, 1 |,| 1 | forma una base para R°? 
2 =9 4 


47. ; forma una base para R‘? 


hos 
Rh a o 


1 1 1 1 
48.5 E E p 3 3 j a forma una base para 
1 1 =1 1 
1 1 1 =] 
RR 
1 0 1 
49. ¿| 1 |,| 1|,| 0 | forma una base para Z3? 
0 1 
1 0 1 
50.5 | 1 |,| 1 |, [| O | forma una base para Z3? 
0 1 1 


En los ejercicios 51 y 52, demuestre que w está en gen(B) y en- 
cuentre el vector coordenada [w]y. 


1 1 1 
51. 5 = 21, 0|p¿w=|6 
0 =] 2 
3 5 1 
52. 5 = 1j, |1|?,w=5]|3 
4 6 4 


En los ejercicios 53-56, calcule el rank y la nulidad de las ma- 
trices dadas sobre el Z , indicado. 


1 1 0 1.1 2 
53.10 1 1ļsobreZ, 54. |2 1 2|sobreZ, 
1.001 2 0 0 
1 3 1 4 
55.|2 3 0 1|sobreZ, 
040 
2 4 0 0 1I 
56. a o 0 sobre Z, 
10225 
1 1 1 1 1 
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57. 


58. 


62. 


63. 


64. 


65. 


66. 
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Introducción a las transformaciones lineales 


Si A es de m X n, demuestre que todo vector en nul(A) 
es ortogonal a todo vector en renglón(A). 


Si A y B son matrices de n X n de rank n, demuestre que 
AB tiene rank n. 


. (a) Demuestre que rank(AB) = rank(B). [Sugerencia: 


revise el ejercicio 29 de la sección 3.1.] 
(b) Ofrezca un ejemplo en el que rank(AB) < 
rank(B). 


. (a) Demuestre que rank(AB) = rank(A). [Sugerencia: 


Revise el ejercicio 30 de la sección 3.1 o use trans- 
puestas y el ejercicio 59(a).] 
(b) Ofrezca un ejemplo en el que rank(AB) = rank(A). 


. (a) Demuestre que si U es invertible, entonces 


rank(UA) = rank(A). [Sugerencia: A = U”*(UA).] 
(b) Demuestre que si V es invertible, entonces rank(AV) 
= rank(A). 
Demuestre que una matriz A de m X n tiene rank 1 si y 
sólo si A puede escribirse como el producto exterior uv” 
de un vector u en R” y v en R”. 


Si una matriz A de m X n tiene rank r, demuestre que A 
puede escribirse como la suma de r matrices, cada una 
de las cuales tiene rank 1. [Sugerencia: encuentre una 
forma de usar el ejercicio 62.] 


Demuestre que, para matrices A y B de m X n, 

rank(A + B) < rank(A) + rank(B). 

Sea A una matriz n X n tal que A? = O. Demuestre que 

rank(A) <= n/2. [Sugerencia: demuestre que col(A) € 

nul(A) y use el teorema del rank.] 

Sea A una matriz antisimétrica n X n. (Vea la página 

168.) 

(a) Demuestre que x" Ax = 0 para todo x en R”. 

(b) Demuestre que I + A es invertible. [Sugerencia: de- 
muestre que nul(I + A) = (0).] 


Introducción a las transformaciones lineales 


En esta sección comienza la exploración de uno de los temas de la introducción a este ca- 
pítulo. Ahí se vio que la matrices pueden usarse para transformar vectores y actuar como 
un tipo de “función” de la forma w = T(v), donde la variable independiente v y la varia- 
ble dependiente w son vectores. Ahora esta noción se hará más precisa y se observarán va- 
rios ejemplos de tales transformaciones matriciales, lo que conduce al concepto de trans- 
formación lineal, una poderosa idea que se encontrará repetidamente a partir de ahora. 
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Comience por recordar algunos de los conceptos básicos asociados con las funcio- 
nes. Se familiarizará con más de estas ideas en otros cursos en los que encontrará fun- 
ciones de la forma f: R—>R [como f(x) = x°] que transforman números reales en nú- 
meros reales. Lo que es novedoso aquí es que están involucrados vectores y que sólo se 
está interesado en funciones que son “compatibles” con las operaciones vectoriales de 
suma y multiplicación escalar. 

Considere un ejemplo. Sean 


1 
A=|2 -1 y v= (| 
3 4 

Entonces 

1 0 

1 
Av=|2 -1 | D a Se 3 

3 4 E 

Esto demuestra que A transforma v en w = 3 


Esta transformación puede describirse de manera más general. La ecuación matricial 
x 


0 

ME 24 =} 
y 

4 3x + 4y 


proporciona una fórmula que muestra cómo A transforma un vector arbitrario n en 
x 
R? en el vector | 2x — y | en RÌ. Esta transformación se denota T, y se escribe 
3x + 4y 


X 


(D; 


3x + 4y 


(Aunque técnicamente desordenada, omitir los paréntesis en definiciones como esta es 
una convención común que ahorra cierta escritura. La descripción de T, se convierte en 


x 

x 
r| |= 2x:= y 
f 3x + 4y 


con esta convención.) 

Con este ejemplo en mente, ahora considere alguna terminología. Una transforma- 
ción (o mapeo o función) T de R” en R” es una regla que asigna a cada vector v en R” un 
vector único T (v) en R”. El dominio de T es R”, y el codominio de T es R”. Esto se in- 
dica al escribir T: R” —> R”. Para un vector v en el dominio de T, el vector T (v) en el co- 
dominio se conoce como la imagen de v bajo (la acción de) T. Al conjunto de todas las po- 
sibles imágenes T (v) (conforme v varía a lo largo del dominio de T) se le llama rango de T. 

En el ejemplo, el dominio de T, es R? y su codominio es R°, así que se escribe 

i 1 
T,: R— R?. La imagen de v = | 1 esw = Ta(v) = | 3 |. Cuál es el rango de T,? 
=] 
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Consiste de todos los vectores en el codominio R? que son de la forma 


x 1 0 

x 
E 2x—y |=x|2|+y| -1 
á 3x + 4y 3 4 


que describe al conjunto de todas las combinaciones lineales de los vectores columna 
1 0 
2 | y | —1 | de A. En otras palabras, ¡el rango de T es el espacio columna de A! (Más 
3 4 


adelante se hablará más acerca de esto; por el momento, simplemente se indicará como 
una comentario interesante.) Geométricamente, esto demuestra que el rango de T, es el 
plano que pasa por el origen en R° con vectores directores dados por los vectores co- 
lumna de A. Note que el rango de T, es estrictamente menor que el codominio de T,. 


Transformaciones lineales 


El ejemplo T, anterior es un caso especial de un tipo más general de transformación lla- 
mada transformación lineal. En el capítulo 6 se considerará la definición general, pero la 
esencia de ella es que se trata de transformaciones que “conservan” las operaciones vec- 
toriales de suma y multiplicación por un escalar. 


Definición Una transformación T : R" —> R” se llama transformación lineal si 


1. T(u + v) = T(u) + T(v) para todo u y ven R” y 
2. T(cv) =cT(v) para todo v en R” y todo escalar c. 


Considere una vez más la transformación T : R? —> R? definida por 


x 


x 
r| - 20 = y 
y 


3x + 4y 


Compruebe que T es una transformación lineal. Para verificar (1), sea 


| a 


Entonces 
E Xx, Fx), 
x x x x 
T(u + v) =a ' + | >) = r(| e >|) =| X(x +x) — (y, + y) 
n e ma 3(x, + x2) + 4 + y) 
Xx Fx), Xx, + xXx), 
=| 24 +26-=4=% |=| 2x% = 11) + (Qu — y) 
3x1 + 3x, + 4y, + 4y, (3x, + 4y,) + Bx + 4y) 


Xi X% 
x x 

=| 24 =y |+| 22 -=y |= z| l + al i = T(u) + T(v) 
3x, + 4y; 3x + 4y, ds de 
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x 


y 


y sea c un escalar. Entonces 


| 
ED- 


i- = (cy) |=] e(2x -= y) 
3(cx) + 4(cy) c(3x + 4y) 


Para demostrar (2), sea v = | 


T(cv) = 


l 


x x 
c| 2x— y = erl |- er) 
3x + 4y 


Por tanto, T es una transformación lineal. 


Comentario La definición de una transformación lineal puede simplificarse al com- 
binar (1) y (2) como se muestra a continuación. 


T: R” — R” es una transformación lineal si 


T(c,w, + cov) = aT(vi) + c,T(v,) para todo v,, v, en R” y escalares c,, c 


En el ejercicio 53 se le pedirá demostrar que el enunciado anterior es equivalente a la de- 
finición original. En la práctica, esta formulación equivalente puede ahorrar alguna es- 
critura, ¡inténtelo! 

Aunque la transformación lineal T en el ejemplo 3.55 originalmente surgió como 
una transformación matricial T,, es asunto sencillo recuperar la matriz A a partir de la 
definición de T dada en el ejemplo. Observe que 


X 1 0 1 0 


x x 
i= 2 = Y 22 a 2 a |f] 
4 3x + 4y 3 4 3 4 dá 
1 0 
de modo que T = T,, donde A = | 2 —1 |. (Note que, cuando las variables x y y se 
3 4 


alinean, la matriz A es justo su matriz de coeficientes.) 

Es importante reconocer que una transformación es una transformación matricial, 
pues, como muestra el siguiente teorema, todas las transformaciones matriciales son 
transformaciones lineales. 


Teorema 3.30 


Sea A una matriz de m X n. Entonces la transformación matricial T, : R"—> R” defi- 
nida por 


T,¡(%) =Ax  (paraxen R”) 


es una transformación lineal. 
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Demostración Sean u y v vectores en R” y sea c un escalar. Entonces 


T¡(u + v) = A(u + v) = Au + Av = T,(u) + T,(v) 


y Talcv) = A(cv) = c(Av) = cT,(v) 


Por tanto, T, es una transformación lineal. 


y 
A 
(1,2) 
Por (x, y) 
ji kd 
ss l I 
1 l 
I { 
HA x 
l l 
l l 
aka ! l 
i è 
A &, y) 
(1, -2) 
Figura 3.4 


Reflexión en el eje x 


> 


Sea F: R? — R? la transformación que envía cada punto a su reflexión en el eje x. De- 
muestre que F es una transformación lineal. 


Solución En la figura 3.4 es claro que F envía el punto (x, y) al punto (x, —y). Por tanto, 
puede escribir 


Podría proceder para comprobar que F es lineal, como en el ejemplo 3.55 (¡esto incluso 
es más sencillo de comprobar!), pero es más rápido observar que 


ole l -l 


1 
0 


x 
y 


matricial. Ahora se tiene, por el Teorema 3.30, que F es una transformación lineal. 


0 
Por tanto, F bl = al | donde A = | 1 | de modo que F es una transformación 
y z 


Ejemplo 3.57 


Figura 3.5 


Una rotación de 90° 


> 


Sea R: R? > R? la transformación que rota cada punto 90° en sentido contrario al de las 
manecillas del reloj en torno al origen. Demuestre que R es una transformación lineal. 


Solución Como muestra la figura 3.5, R envía el punto (x, y) al punto (—y, x). Por 


tanto, se tiene 
x =y 0 = 0 =1||x 
R = =x +y = 
y x 1 0 1 OlLy 
En consecuencia, R es una transformación matricial y por lo tanto es lineal. 


e 


Observe que, si multiplica una matriz por vectores base estándar, obtiene las colum- 
nas de la matriz. Por ejemplo, 


a b a a b b 
e y e AG 


Puede usar esta observación para demostrar que toda transformación lineal de R” en R” 
surge como una transformación matricial. 


222 


Capítulo 3 Matrices 


Teorema 3.31 


Sea T : R” —> R” una transformación lineal. Entonces T es una transformación ma- 
tricial. De manera más específica, T = T,, donde A es la matriz de m X n 


A = [T(e,):T(e,):+T(0,)] 


Demostración Sean e, e,, . . . , €, los vectores base estándar en R” y sea x un vector en 
R”. Puede escribir x = x,e, + x,e, ++ + x,e, (donde las x; son los componentes de x). 


n”n 


También se sabe que T(e,), T(e,), ..., T(e,) son vectores (columna) en R”. Sea A = 
[T(e,):T(e,): :**:T(e,)] la matriz de m X n con dichos vectores como sus columnas. 
Entonces 


T(x) = T(xe, + x3€, + 0: + x,,) 
x T(e,) + x,T(e,) + + x,T(e,,) 


Xx] 


A — 
como se requiere. 


La matriz A en el Teorema 3.31 se llama matriz estándar de la transformación lineal T. 


> 


»—> 


Demuestre que una rotación en torno al origen, a través de un ángulo 0, define una 
transformación lineal de R? en R? y encuentre su matriz estándar. 


Solución Sea R, la rotación. Se dará un argumento geométrico para establecer el hecho 
de que R, es lineal. Sean u y v vectores en R?. Si no son paralelos, entonces la figura 3.6(a) 
muestra la regla del paralelogramo que determina u + v. Si ahora se aplica R,, todo el 
paralelogramo rota un ángulo 0, como se muestra en la figura 3.6(b). Pero la diagonal de 
este paralelogramo debe ser R¿(u) + R,(v), de nuevo, por la regla del paralelogramo. Por 
tanto, R¿(u + v) = R,(u) + Ry(v). (¿Qué ocurre si u y v son paralelos?) 


(a) (b) 
Figura 3.6 


De igual modo, si se aplica R} a v y cv, se obtiene R¿(v) and R,(cv), como se muestra 
en la figura 3.7. Pero, dado que la rotación no afecta las longitudes, entonces se debe 
tener Ry(cv) = cRy(v), como se requiere. (Dibuje diagramas para el caso 0 < c < 1, —1 
<c<0yc<-—1.) 
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y 
A 
(cos 6, sen 0) 
y 
A 
Ry(cv) cv 
>x 
Figura 3.7 Figura 3.8 


Ry(e,) 


Por tanto, Ry es una transformación lineal. De acuerdo con el Teorema 3.31, se puede 
encontrar su matriz al determinar su efecto sobre los vectores base estándar e, y e, de R?. 


1 cos 0 
Ahora, como muestra la figura 3.8, Rọ = ` 
0 sen 0 


0 0 
Puede encontrar Al ' | de igual forma, pero es más rápido observar que r| r | debe 


1 
ser perpendicular (en sentido contrario al de las manecillas del reloj) a ra| | y por 


. 0 —sen 0 
tanto, por el ejemplo 3.57, Rọ i= osë (figura 3.9). 


cos 0 pu 


En consecuencia, la matriz estándar de R, es 
sen 0 cos 0 


E 


(cos 6, sen 0) 


(—sen 0, cos 0) 


Ry(e,) t 


Ahora puede usar el resultado del ejemplo 3.58 para calcular el efecto de cualquier 
rotación. Por ejemplo, suponga que quiere rotar 60° el punto (2, — 1) en torno al origen. 
(La convención es que un ángulo positivo corresponde a una rotación en sentido con- 
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ji 
T 
~A 
N 
| 
(=à 
= 


Figura 3.10 


Una rotación de 60° 


trario al de las manecillas del reloj, mientras que un ángulo negativo es en el sentido de 
las manecillas del reloj.) Dado que cos 60° = 1/2 y sen 60° = V3/2, se calcula 


alas call 
(2 + u 
(2V3 — 1)/2 


Por tanto, la imagen del punto (2, —1) bajo esta rotación es el punto ((2 + v3)/2, 
(2V3 — 1)/2) = (1.87, 1.23), como se muestra en la figura 3.10. 


Figura 3.11 


Una proyección 


> 
(a) Demuestre que la transformación P : R? —> R? que proyecta un punto sobre el eje x 
es una transformación lineal y encuentre su matriz estándar. 

(b) De manera más general, si € es una recta que pasa por el origen en R?, demuestre que 
la transformación P; : R? —> R? que proyecta un punto sobre / es una transformación li- 
neal y encuentre su matriz estándar. 


Solución (a) Como muestra la figura 3.11, P envía el punto (x, y) al punto (x, 0). Por 


AAA E 


Se tiene que P es una transformación matricial (y en consecuencia una transformación 
. ; , 1.0 
lineal) con matriz estándar o ol 


(b) Sea la recta £ que tiene vector director d y sea v un vector arbitrario. Entonces P, está 
dado por proy¿(v), la proyección de v sobre d, que de la sección 1.2 recordará tiene la 


fórmula 
d-v 
=|-— ld 


Por tanto, para demostrar que P, es lineal, se procede del modo siguiente: 


- (a + (z) = Pdu) + P(v) 


De igual modo, P; (cv) = cP¿(v) para cualquier escalar c (ejercicio 52). En consecuencia, 
P; es una transformación lineal. 
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Para encontrar la matriz estándar de P, aplique el Teorema 3.31. Si se hace 


d 
d= | f |, entonces 
d-e; dı la 1 Fi 
Po = d= = 
des) (5) d? + dld,| d+ las, 


. d, a] 1 le 
Pde) = d= = 
Y dez) e d? + F d+ dla 


Por tanto, la matriz estándar de la proyección es 


1 | d? A _ | di/(d? + d3) dıd/(d? + A 


 di+dldd d | ldd/d+da) d/(al +d) 


Como comprobación, note que en el inciso (a) podría tomar d = e, como un vector 


> : y 1 0 
director para el eje x. Por tanto, d, = 1 y d, = 0, y se obtiene A = y p “omo antes. 


ai 


Si T: R” => R” y S : R” — R’ son transformaciones lineales, entonces puede seguir T por 
S para formar la composición de las dos transformaciones, denotada S ° T. Note que, 
para que S ° T tenga sentido, el codominio de T y el dominio de S deben coincidir (en 
este caso, ambos son R”) y la transformación compuesta resultante S ° T va del dominio 
de T al codominio de S (en este caso, S ° T : R” — R?). La figura 3.12 muestra de manera 
esquemática cómo funciona esta composición. La definición formal de composición de 
transformaciones se toma directamente de esta figura y es igual que la correspondiente 
definición de composición de funciones ordinarias: 


Nuevas transformaciones lineales a partir de otras anteriores 


(So T)(v) = S(T(v)) 


Desde luego, le gustaría que S ° T también fuese una transformación lineal, y feliz- 
mente se encuentra que lo es. Esto se puede demostrar al mostrar que S ° T satisface la 
definición de transformación lineal (lo que se hará en el capítulo 6), pero, dado que por 
el momento se supone que las transformaciones lineales y las transformaciones matri- 
ciales son la misma cosa, es suficiente demostrar que S ° T es una transformación matri- 
cial. Se usará la notación [T] para la matriz estándar de una transformación lineal T. 


R” R” R? 


va IN) = (S ° T)(v) 


Figura 3.12 


La composición de transformaciones 
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Teorema 3.32 


Sean T: R” > R” y S : R” — R transformaciones lineales. Entonces, S ° T : R” —> R? 
es una transformación lineal. Más aún, sus matrices estándar están relacionadas me- 
diante 


[Se TIA 


Demostración Sean [S] = Ay [T] = B. (Note que A es de p X ny Bes de n X m.) Siv 
es un vector en R”, entonces simplemente se calcula 


(So T)(v) = S(T(v)) = S(Bv) = A(Bv) = (AB)v 


(Note aquí que las dimensiones de A y B garantizan que el producto AB tenga sentido.) 
Por tanto, se ve que el efecto de S ° T es multiplicar vectores por AB, de donde se tiene in- 


mediatamente que S° T es una transformación matricial (por tanto, lineal) con [S° T] 
= [S][T]. — 


¿No es un gran resultado? Dicho con palabras: “la matriz de la composición es el pro- 
ducto de la matrices”. ¡Vaya fórmula adorable! 


Considere la transformación lineal T : R? > R? del ejemplo 3.55, definida por 
Xi 
*1 
r| | =| 2% =% 
3x, + 4x 


y la transformación lineal S : R’ — R* definida por 


2y: + y 

4 37, — y 

s| y, | = 2 3 

y Y1 TY 
3 

Y ty ty 


Encuentre S° T : R — R*, 


Solución Se ve que las matrices estándar son 


2 0 1 
0 3 =l : A 
S| = T|]=|2 =l 
=|; or m 
3 4 
1 1 1 
de modo que el Teorema 3.32 produce 
2 0 1 5 4 
0 3 =l i N 3 =g 
SoT] =[S]|T] = 2 -1|= 
[so T]=[SITI=| 7, E 
3 4 
1 1 1 6 3 
Se tiene que 
5 4 5x, + 4x, 
ne] z 3 -7 E _ | 3x — 7% 
X =1 1 Lx) =% + % 


Sección 3.6 Introducción a las transformaciones lineales 221 


(En el ejercicio 29 se le pedirá comprobar este resultado al hacer 


Yi Xi 

*X 
Yal S= al | =| 24 =% 
y 3x, + 4x, 


y sustituir estos valores en la definición de S, y de este modo calcular directamente 


enf A 


X2 
| e 


Ejemplo 3.61 Encuentre la matriz estándar de la transformación que primero rota un punto 90° en 
sentido contrario al de las manecillas del reloj en torno al origen y luego refleja el resul- 
tado en el eje x. 


Solución La rotación R y la reflexión F se discutieron en los ejemplos 3.57 y 3.56, 


; . A 0 =1 
respectivamente, de donde se encuentra que sus matrices estándar son [R] = io 


1 0 
y[F] = | i | Se tiene que la composición Fo R tiene por su matriz 


0 
Id A al la o 


p—> (Compruebe que este resultado es correcto al considerar el efecto de Fo R sobre los vec- 
tores base estándar e, y e,. Note la importancia del orden de las transformaciones: R se 
realiza antes que F, pero se escribe F > R. En este caso, R o F también tiene sentido. 


¿Ro F= F° R?) 


inversas de transformaciones lineales 


Considere el efecto de una rotación de 90° en sentido contrario al de las manecillas del 
reloj en torno al origen, seguida por una rotación de 90° en el sentido de las manecillas 
del reloj. Claramente, esto deja todo punto en R? sin cambios. Si estas transformaciones 
se denotan Ro y R—oọ (recuerde que un ángulo negativo corresponde a dirección con- 
traria a la de las manecillas del reloj), entonces puede expresar esto como (Ryo 2 R_ gp) (V) 
= y para todo v en R°. Note que, en este caso, si realiza las transformaciones en el otro 
orden, obtiene el mismo resultado final: (R_¿y ° R) (V) = v para todo v en R°. 

Por tanto, Ryy ° Ro (y también R_ gy ° Roy) es una transformación lineal que deja 
todo vector en R? sin cambio. Tal transformación se conoce como transformación iden- 
tidad. En general, se tiene una de tales transformaciones para todo R”; a saber, I : R” > 
R” tal que I(v) = v para todo v en R”. (Si es importante seguir la pista de la dimensión 
del espacio, puede escribir 1, por claridad.) 

De este modo, con esta notación, se tiene Ro ° Roo = I = Ro ° Roo. Un par de 
transformaciones que se relacionan mutuamente de esta forma se llaman transforma- 
ciones inversas. 


Definición Sean S y T transformaciones lineales de R” a R”. Entonces S y T son 
transformaciones inversas si So T =1, y T° S = I, 
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Comentario Dado que esta definición es simétrica con respecto a S y T, se dirá que, 
cuando ocurre esta situación, S es el inverso de T y T es el inverso de S. Más aún, se dirá 
que S y T son invertibles. 


En términos de matrices, se ve inmediatamente que si S y T son transformaciones in- 
versas, entonces [S][T] = [So T] = [I] = I, donde la última 1 es la matriz identidad. 
(¿Por qué la matriz estándar de la transformación identidad es la matriz identidad?) 
También se debe tener [T'][S] = [T° S] = [I] = I. Esto demuestra que [S ] y [T ] son ma- 
trices inversas. Demuestra algo más: si una transformación lineal T es invertible, enton- 
ces su matriz estándar [T] debe ser invertible, y dado que los inversos matriciales son 
únicos, esto significa que la inversa de T también es única. Por tanto, puede usar sin am- 
bigúedad la notación T”* para referirse a la inversa de T. Por tanto, puede reescribir las 
ecuaciones anteriores como [T][T7*] = I = [T”*][T], lo que muestra que la matriz de 
T~" es la matriz inversa de [T]. Se acaba de demostrar el siguiente teorema. 


Teorema 3.33 


Sea T : R” —> R” una transformación lineal invertible. Entonces su matriz estándar 
[T] es una matriz invertible y 


Comentario También enuncie esto con palabras: “la matriz de la inversa es la in- 
versa de la matriz”. ¡Fabuloso! 


Ejemplo 3.62 


> 
Encuentre la matriz estándar de una rotación de 60° en el sentido de las manecillas del 
reloj en torno al origen en R?. 


Solución Anteriormente se calculó la matriz de una rotación de 60° en sentido contra- 
rio al de las manecillas del reloj en torno al origen como 


1/2 —v43/2 
[Reo] = 
v3/2 1/2 
Dado que una rotación de 60° en el sentido de las manecillas del reloj es el inverso de una 


rotación de 60° en sentido contrario al de las manecillas del reloj, puede aplicar el Teo- 
rema 3.33 para obtener 


1/2 el 1/2 a] 


[Re] = [(Reo) *] = E 1/2] — L-vy3/2 1/2 


(Compruebe el cálculo de la inversa matricial. La forma más rápida es usar la abreviatura 
2 X 2 del Teorema 3.8. También compruebe que la matriz resultante tiene el efecto co- 
rrecto sobre la base estándar en R? al dibujar un diagrama.) 


so 
Determine si la proyección sobre el eje x es una transformación invertible y, si lo es, en- 
cuentre su inversa. 


se a ; 1 0 ; ; 
Solución La matriz estándar de esta proyección P es E r | que no es invertible pues 


su determinante es 0. Por tanto, P no es invertible tampoco. f 


e (a, b) 
| 
e (a, b”) 
I 
pe 0) 


l 
ė(a, b'”) 


Figura 3.13 
Las proyecciones no son 
invertibles 


Í tjercicios 3.6 
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Comentario La figura 3.13 da alguna idea de por qué P en el ejemplo 3.63 no es in- 
vertible. La proyección “colapsa” R? sobre el eje x. Para que P sea invertible, habría que 
tener una forma de “deshacerlo” para recuperar el punto (a, b) con el que se comenzó. 
Sin embargo, existe un número infinito de candidatos para la imagen de (a, 0) bajo tal 
“inverso” hipotético. ¿Cuál usaría? No puede decir simplemente que P~! debe enviar (a, 
0) a (a, b), pues esto no puede ser una definición cuando no hay forma de saber cuál debe 
ser b. (Vea el ejercicio 42.) 


El Teorema 3.3(a) de la sección 3.2 enuncia la propiedad de asociatividad para la multi- 
plicación matricial: A(BC) = (AB)C. (Si no trató de demostrarlo entonces, hágalo 
ahora. Incluso con todas las matrices restringidas de 2 X 2 , obtendrá cierto sentimiento 
de la complejidad notacional involucrada en una prueba “por elementos”, que debe ha- 
cerlo apreciar la demostración que está a punto de darse.) 

El planteamiento de la demostración es vía transformaciones lineales. Se vio que 
toda matriz A de n X n da lugar a una transformación lineal T, : R” => R” por el con- 
trario, toda transformación lineal T': R” —> R” tiene una correspondiente matriz [T ] de 
m X n. Las dos correspondencias están inversamente relacionadas; esto es, dada A, [T,] 
= A, y dada T, Tir] =T. 

Sea R = Ty S = T, y T = To Entonces, por el Teorema 3.32, 


A(BC) = (AB)C siysólosi Ro(SoT)=(RoS)oT 


Ahora se demuestra la última identidad. Sea x en el dominio de T (y por tanto en el do- 
minio tanto de R° (S° T) como de (R° S) e T; ¿por qué?). Para demostrar que R° (So T) 
= (R° S) o T, es suficiente demostrar que tienen el mismo efecto sobre x. Mediante la 
aplicación repetida de la definición de composición, se tiene 


(R ° (S ° T))(x) = RUS ° T)(x)) 
= R(S(T(x))) 
= (R ° S)(T(x)) = ((R ° $) ° T)(x) 


como se requería. (Compruebe cuidadosamente cómo se usó cuatro veces la definición 
de composición.) 

Esta sección sirvió como introducción a las transformaciones lineales. En el capítulo 6 
se observarán con más detalle y más generalidad estas transformaciones. Los ejercicios 
que siguen también contienen algunas exploraciones adicionales de este importante 
concepto. 


Y 


1. Sea T, : R? — R? la transformación matricial 2. Sea T, : R? — R? la transformación matricial corres- 


3 =1 


2 =] é 
correspondiente a A = | Al Encuentre pondienteaA = | 1 2 |. Encuentre T, (u) y T; (v), 


1 3 
T, (u) y T, (v), donde u = A = [2] inden BE _ pel! 


1 4 


2 2 
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En los ejercicios 3-6, pruebe que la transformación dada es 
una transformación lineal, usando la definición (o el Comen- 
tario que sigue al ejemplo 3.55). 


x + 2y 
x x+y x 
nfl af 
poe 
y y y 3x — 7y 
x x 
x=y>+z 
5. T = 6. T | y|= x+y 
2x + y — 3z 
z x+y+z 


En los ejercicios 7-10, proporcione un contraejemplo para de- 
mostrar que la transformación dada no es una transformación 


A A-A 
A erat 


En los ejercicios 11-14, encuentre la matriz estándar de la 


transformación lineal en el ejercicio dado. 
11. Ejercicio 3 12. Ejercicio 4 


13. Ejercicio 5 14. Ejercicio 6 


En los ejercicios 15-18, demuestre que la transformación dada 

de R? a R? es lineal, al demostrar que es una transformación 

matricial. 

15. F refleja un vector en el eje y. 

16. R rota un vector 45° en sentido contrario al de las ma- 
necillas del reloj en torno al origen. 

17. D estira un vector por un factor de 2 en el componente 
x y un factor de 3 en el componente y. 

18. P proyecta un vector sobre la recta y = x. 


19. Los tres tipos de matrices elementales dan lugar a cinco 
tipos de matrices de 2 X 2 con uno de las formas si- 


guientes: 
| ] | ' ] 
0 1 0 k 


Cada una de estas matrices elementales corresponde a una 
transformación lineal de R? en R°. Realice dibujos para ilus- 
trar el efecto de cada una sobre el cuadrado unitario con vér- 
tices en (0, 0), (1, 0), (0, 1) y (1, 1). 


En los ejercicios 20-25, encuentre la matriz estándar de la 
transformación lineal dada de R? a R?, 


20. Rotación en sentido contrario al de las manecillas del 
reloj de 120? en torno al origen. 


21. Rotación en el sentido de las manecillas del reloj 30? en 
torno al origen. 
22. Proyección sobre la recta y = 2x 
23. Proyección sobre la recta y = —x 
24. Reflexión en la recta y = x 
25. Reflexión en la recta y = —x 
26. Sea € una recta que pasa por el origen en R?, P, la trans- 
formación lineal que proyecta un vector sobre £ y F, la 
transformación que refleja un vector en £. 
(a) Dibuje diagramas para demostrar que F, es lineal. 
(b) La figura 3.14 sugiere una forma de encontrar la 
matriz de F, usando el hecho de que las diagonales 
de un paralelogramo se bisectan mutuamente. De- 
muestre que F; (x) = 2P¿(x) — x y use este resul- 
tado para demostrar que la matriz estándar de F, es 


1 (a Cal 
d? + d| 2dd, d? + a? 


d 
(donde el vector director de € es d = | ih 
2 
(c) Si el ángulo entre £ y el eje x positivo es 0, de- 


muestre que la matriz de F, es 
| cos 20 
sen 20 


sen ao 
—cos 20 


Figura 3.14 


En los ejercicios 27 y 28, aplique el inciso (b) o (c) del ejercicio 
26 para encontrar la matriz estándar de la transformación. 


27. Reflexión en la recta y = 2x. 


28. Reflexión en la recta y = VW3x 


29. Compruebe la fórmula para S ° T en el ejemplo 3.60 al 
realizar la sustitución directa sugerida. 


En los ejercicios 30-35, verifique el Teorema 3.32 al encontrar 
la matriz de S ° T (a) mediante sustitución directa y (b) me- 
diante multiplicación matricial de [S] [T]. 


30. q] z [x E al! s” Z [Ed 
LX] Lx + x) Va Y, 
31. T Xj |% + 2x, ke] — ” + a] 
LX] [3x1 + xa Ya Vi =y 
- - +3 
x] Tx Y Yi Ya 
32. T = ,S 29, + Ya 
LX) ] LTX J2 
yı» 


x 
33. T ! E E + Xx) 7 Xx El — j = A 


ţl|= 
i 2x; — X + x3 Y =y + y 
X3 
x YY 

e a A ls + J s” _ 1 " 2 

* 2 2x, —x, > Y Yi Ya 

X3 4 TX 
X1 Xi as Xa Yı Yi e Y 

35. T Xl = | X F X J9 Ya = Ya = Y3 
X3 Xx, + Xx; y3 =y, + Y 


En los ejercicios 36-39, encuentre la matriz estándar de la 
transformación compuesta de R? a R?. 


36. Rotación en sentido contrario al de las manecillas del 
reloj de 60°, seguida por reflexión en la recta y = x 


37. Reflexión en el eje y, seguida por rotación de 30° en sen- 
tido de las manecillas del reloj 


38. Rotación de 45° en sentido de las manecillas del reloj, 
seguida por proyección sobre el eje y, seguida por rota- 
ción de 45° en el sentido de las manecillas del reloj 

39. Reflexión en la recta y = x, seguida por rotación de 30° 
en sentido contrario al de las manecillas del reloj, se- 
guida por reflexión en la recta y = —x 


En los ejercicios 40-43, use matrices para probar los enuncia- 

dos dados acerca de las transformaciones de R? en R?. 

40. Si Rọ denota una rotación (en torno al origen) en un án- 
gulo 0, entonces R, ° Rg = Ry ge 
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41. Si 0 es el ángulo entre las rectas € y m (que pasan por el 
origen), entonces F,, + F; = R}. (Vea el ejercicio 26.) 
42. (a) Si P es una proyección, entonces Po P = P. 
(b) La matriz de una proyección nunca puede ser in- 
vertible. 


43. Si £, m y n son tres rectas que pasan por el origen, en- 
tonces F, o F, e F, es también una reflexión que pasa por 
el origen. 

44. Sea T una transformación lineal de R? a R? (o de Ria 
R°). Demuestre que T mapea una recta en una recta o 
un punto. [Sugerencia: use la forma vectorial de la ecua- 
ción de una recta.] 

45. Sea T una transformación lineal de R? a R? (o de Ra 
R°). Pruebe que T mapea rectas paralelas a rectas para- 
lelas, una sola recta, un par de puntos, o un solo punto. 


En los ejercicios 46-51, sea ABCD el cuadrado con vértices 
(1, D, (1 D, (1, —1) y (1, —1). Use los resultados en los 
ejercicios 44 y 45 para encontrar y dibujar la imagen de 
ABCD de acuerdo con la transformación dada. 


46. T en el ejercicio 3 

47. D en el ejercicio 17 

48. P en el ejercicio 18 

49. La proyección en el ejercicio 22 

50. T en el ejercicio 31 

51. La transformación en el ejercicio 37 

52. Demuestre que P; (cv) = cP¿(v) para cualquier escalar c 
[Ejemplo 3.59(b)]. 

53. Demuestre que T : R” —> R” es una transformación li- 
neal si y sólo si 


T(c¡v, + cava) = c,T(v,) + c,T(v,) 


n 
para todo v}, v, en R” y escalares c}, C,. 


54. Demuestre que (como se anotó al comienzo de esta sec- 
ción) el rango de una transformación lineal T : R” —> 
R” es el espacio columna de su matriz [T]. 


55. Si A es una matriz invertible de 2 X 2, ¿qué afirma el 
teorema fundamental de las matrices invertibles acerca 
de la correspondiente transformación lineal T, a la luz 
del ejercicio 19? 


Canadarm 


En 1981, el transbordador espacial estadounidense Columbia despegó con un dispositivo 
llamado Shuttle Remote Manipulador System (SRMS, sistema manipulador remoto del 
transbordador). Este brazo robótico, conocido como Canadarm, resultó ser una herra- 
mienta vital en todas las misiones posteriores del transbordador espacial, pues propor- 
cionó una manipulación firme, aunque precisa y delicada, de sus cargas (vea la figura 
3.15). 

Canadarm se ha usado para poner satélites en su Órbita adecuada y para recuperar 
los que funcionan mal para repararlos, y también ha realizado reparaciones cruciales al 
mismo transbordador. Notablamente, el brazo robótico fue útil en la reparación exitosa 
del Telescopio Espacial Hubble. Desde 1998, Canadarm tiene un papel importante en el 
ensamblado de la Estación Espacial Internacional. 


NASA 


Un brazo robótico consiste de una serie de vástagos de longitud fija conectados en 
articulaciones donde pueden rotar. En consecuencia, cada vástago rota en el espacio o 
(mediante el efecto de los otros vástagos) se traslada paralelo a sí mismo, o se mueve me- 
diante una combinación (composición) de rotaciones y traslaciones. Antes de poder di- 
señar un modelo matemático para un brazo robótico, es necesario entender cómo fun- 
cionan las rotaciones y traslaciones en composición. Para simplificar las cosas, se 
supondrá que el brazo está en R°. 


NASA 


v = | |, entonces una traslación a lo largo de v es la transformación 


T 


T(x)=x+v ode manera equivalente, r|*| = | 
y 935 lo 


[figura 3.16(b)]. 


y 
A A TX) =x + v 
R(x) x 
xX 
0 
v 

>x >X 

(a) Rotación (b) Traslación 


Figura 3.16 


Por desgracia, la traslación no es una transformación lineal, porque T(0) # 0. Sin em- 
bargo, hay un truco que dará la vuelta a este problema. Puede representar el vector 
x 
x= P como el vector | y | en R°. A esto se le llama representar x en coordenadas 
a 1 
homogéneas. Entonces la multiplicación matricial 


1 0 alix x+a 
0 1 blly|=|y+b 
0 0 1 1 1 


representa al vector trasladado T(x) en coordenadas homogéneas. 
También puede tratar las rotaciones en coordenadas homogéneas. La multiplicación 
matricial 


cos —sen0 0||x xcosO — ysen0 
senó cosg 0||y|=|xsenó + ycosO 
0 0 1/L1 1 


representa el vector rotado R(x) en coordenadas homogéneas. La composición T° R que 
produce la rotación R seguida por la traslación T ahora se representa mediante el pro- 
ducto 


1 0 aj|cosg —senó 0 cosg —sen0 a 
0 1 b||senó coso 0|=| send cosôð b 
0 0 1 0 0 1 0 0 1 


(Note que Re T + ToR.) 
Para modelar un brazo robótico, proporcione a cada vástago su propio sistema co- 
ordenado (llamado marco) y examine cómo se mueve un vástago en relación con aque- 
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alo largo de] | (figura 3.17). Esta transformación se representa en coordenadas ho- 


mogéneas mediante la matriz 


cos0; —sen0; aj; 
T; = | sen6; coso; 0 
0 0 1 


Yi-1 
A 


Figura 3.17 


Para dar un ejemplo específico, considere la figura 3.18(a). En ella se muestra un 
brazo con tres vástagos en el que 4, está en su posición inicial y cada uno de los otros 
dos vástagos rotó 45° desde el vástago previo. La longitud de cada vástago se considerará 
en 2 unidades. La figura 3.18(b) muestra A, en su marco inicial. La transformación 


cos45 —sen45 2 1/42 -—1/y42 2 
T; = | sen45 cos45 0|=|1/y2  1/y2 0 
0 0 1 0 0 1 


causa una rotación de 45° y luego una traslación de 2 unidades. Como se muestra en 
3.18(c), esto coloca a A, en su posición adecuada en relación con el marco de A,. A con- 
tinuación, la transformación 


cos45 —sen45 2 1/ V2 =1/42 2 
T, = | sen45 cos45 0|=|1/y2  1/y2 0 


0 0 1 0 0 1 


se aplica al resultado anterior. Esto coloca tanto a A, como a A, en su posición correcta 
en relación con A,, como se muestra en la figura 3.18(d). Por lo general, al resultado pre- 
vio se aplicaría una tercera transformación T; (una rotación), pero en este caso, T es la 
transformación identidad porque A, permanece en su posición inicial. 

Usualmente se quiere conocer las coordenadas del extremo (la “mano”) del brazo ro- 
bótico, dados los parámetros de longitud y ángulo; esto se conoce como forward kine- 
matics, cinemática hacia adelante. Al continuar con la secuencia de cálculos anterior y 


PU 
1] ES 
BERTA] 


_— 


(a) Una cadena de tres vástagos (b) Az en su marco inicial 
Y2 Y1 
A A 
A3 
Az A) 
A) Aj 
> X2 > X] 
(c) Tz pone a Az en el marco inicial de A> (d) DT} pone a Az en el marco inicial de Aj 

Figure 3.18 


consultar la figura 3.18, se ve que es necesario determinar dónde termina el punto (2, 0) 
después de aplicar T, y T,. Por tanto, la mano del brazo está en 


2 1/ V2 =142 2ľ[2 0 -1 2+vy2][2 
TT Jo|=|1/y2 1/y2 o|lo|=|1 0 vZ llo 
1 0 0 1 1 0 0 1 1 
2+V2 
=|2+V2 
1 
que representa el punto (2+ V2, 2+ V2) en coordenadas homogéneas. Fácilmente se 
comprueba, a partir de la figura 3.18(a), que esto es correcto. 
Los métodos empleados en este ejemplo se generalizan a brazos robóticos en tres di- 
mensiones, aunque en R? existen más grados de libertad y por tanto más variables. El 


método de coordenadas homogéneas también es útil en otras aplicaciones, notable- 
mente en gráficos de computadora. 
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Andrei A. Markov (1856-1922) fue 
un matemático ruso que estudió y 
más tarde impartió clases en la 
Universidad de San Petersburgo. 
Estuvo interesado en teoría de 
números, análisis y teoría de las 
fracciones continuas, un campo 
recientemente desarrollado que 
Markov aplicó a la teoría de pro- 
babilidad. Markov también es- 
tuvo interesado en la poesía y 
uno de los usos que dio a las 
cadenas de Markov fue el análisis 
de patrones en poemas y otros 
textos literarios. 


Aplicaciones 


Un equipo de investigación de mercado realiza un estudio controlado para determinar 
qué dentífricos prefieren las personas. La muestra consiste de 200 personas, y a cada una 
se le pide probar dos marcas de dentífrico durante un periodo de varios meses. Con base 
en las respuestas de la encuesta, el equipo de investigación compila las siguientes esta- 
dísticas acerca de las preferencias de dentífrico. 

De quienes usan la marca A en cualquier mes, 70% siguen usándola el mes siguiente, 
mientras que 30% cambia a la marca B; de quienes usan la marca B en cualquier mes, 
80% siguen usándolo el mes siguiente, mientras que 20% cambian a la marca A. Estos 
hallazgos se resumen en la figura 3.19, en la que los porcentajes se convirtieron en deci- 
males; se pensará en ellos como probabilidades. 


0.30 


0.70 (a) 0.80 


0.20 
Figura 3.19 


La figura 3.19 es un ejemplo simple de una cadena de Markov (finita). Representa 
un proceso evolutivo que consiste de un número finito de estados. En cada paso o punto 
en el tiempo, el proceso puede estar en cualquiera de los estados; en el paso siguiente, el 
proceso puede permanecer en su estado presente o cambiar a uno de los otros estados. 
El estado hacia donde avanza el proceso en el siguiente paso y la probabilidad de hacerlo 
depende solamente del estado presente y no de la historia pasada del proceso. Estas pro- 
babilidades se conocen como probabilidades de transición y se suponen constantes (esto 
es: la probabilidad de moverse del estado i al estado j siempre es la misma). 


Ejemplo 3.64 


En el estudio de dentífricos descrito anteriormente, existen sólo dos estados (usar la 
marca A y usar la marca B) y las probabilidades de transición son las indicadas en la fi- 
gura 3.19. Suponga que, cuando comienza el estudio, 120 personas usan la marca A y 80 
personas usan la marca B. ¿Cuántas personas usarán cada marca 1 mes más tarde? ¿Y 2 
meses más tarde? 


Solución Fl número de usuarios de la marca A después de 1 mes será 70% de los que 
inicialmente usan la marca A (quienes siguen siendo leales a la marca A) más 20% de los 
usuarios de la marca B (quienes cambian de Ba A): 


0.70(120) + 0.20(80) = 100 


De igual modo, el número de usuarios de la marca B después de 1 mes será una combi- 
nación de quienes cambian a la marca B y quienes siguen usándola: 


0.30(120) + 0.80(80) = 100 
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Estas dos ecuaciones pueden resumirse en una sola ecuación matricial: 
bado 0.20 |[ 120] — ad 
0.30 0.80]_ 80 100 


Llame P a la matriz y marque los vectores xy = | a yx = | ps | (Note que los 
80 100 
componentes de cada vector son el número de usuarios de las marcas A y B, en ese orden, 
después del número de meses indicado por el subíndice.) Por tanto, se tiene x, = PX. 
Al extender la notación, sea x, el vector cuyos componentes registran la distribución 
de usuarios de dentífrico después de k meses. Para determinar el número de usuarios de 
cada marca después de transcurridos 2 meses, simplemente aplique el mismo razona- 
miento comenzando con x; en lugar de x,. Se obtiene 


bel al dl el 

x = Px = = 

0.30 0.80 || 100 110 

de donde se ve que ahora existen 90 usuarios de la marca A y 110 usuarios de la marca B. 


„t 


Los vectores x, en el ejemplo 3.64 se llaman vectores de estado de la cadena de Mar- 
kov, y la matriz P se llama matriz de transición. Acaba de ver que una cadena de Markov 
satisface la relación 


X ı = PAPA 0, 1,2... 


A partir de este resultado se tiene que es posible calcular un vector de estado arbitrario 
de manera iterativa una vez se conoce xX, y P. En otras palabras, una cadena de Markov 
está completamente determinada por sus probabilidades de transición y su estado inicial. 


Comentarios 

+ Suponga que en el ejemplo 3.64 se quiere seguir la pista no de los números reales 
de usuarios de dentífrico, sino de los números relativos que usan cada marca. Podría con- 
vertir los datos en porcentajes o fracciones al dividir el número total de usuarios entre 


200. Por tanto, comenzaría con 
201 0.40 


para reflejar el hecho de que, inicialmente, la división marca A-marca B es 60%-40%. 


Compruebe mediante cálculo directo que Px, = | | que entonces puede tomarse 


0.50 
como x; (en concordancia con la división 50-50 que se calculó anteriormente). Los vec- 
tores como este, con componentes no negativos que suman 1, se llaman vectores de pro- 
babilidad. 

+ Observe cómo se ordenan las probabilidades de transición dentro de la matriz de 
transición P. Puede considerar a las columnas como etiquetadas con los estados presente 
y los renglones como etiquetados con los estados siguiente: 


Presente 
A B 
A pe i 


Siguiente 
B L0.30 0.80 
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La palabra estocástico se deriva del 
adjetivo griego stokhastikos, que 
significa “capaz de conjeturar” (o 
adivinar). Llegó a aplicarse a algo 
que está gobernado por las leyes de 
la probabilidad en el sentido de 
que la probabilidad realiza predic- 
ciones acerca de la posibilidad de 
que ocurran las cosas. En teoría de 
probabilidad, los “procesos esto- 
cásticos” forman una generaliza- 
ción de las cadenas de Markov. 


Ds A049 
y En a 
K me 
"N 


B 0.24* 
Figura 3.20 


Note también que las columnas de P son vectores de probabilidad; cualquier matriz cua- 
drada con esta propiedad se llama matriz estocástica. 


Puede darse cuenta de la naturaleza determinista de las cadenas de Markov en otra 
forma. Note que puede escribir 


x = Px, = P(Px,) = P*x, 
y, en general, 
x, = P'x, para k=0,1,2,... 


Esto conduce a examinar las potencias de una matriz de transición. En el ejemplo 
3.64 se tiene 


p- K a] e al B hos mu 
0.30 0.80 /10.30 0.80 0.45 0.70 
¿Qué se hará con las entradas de esta matriz? Lo primero que debe observar es que p? es 
otra matriz estocástica, pues sus columnas suman 1. (Se le pedirá probar esto en el ejer- 
cicio 14.) ¿Podría ser que P? también sea una matriz de transición del mismo tipo? Con- 
sidere una de sus entradas, por ejemplo, (P?),, = 0.45. Los tres diagramas de la figura 
3.20 clarifican de dónde provienen estas entradas. 

Existen cuatro posibles cambios de estado que pueden ocurrir durante 2 meses y co- 
rresponden a las cuatro ramas (o rutas) de longitud 2 en el árbol. Alguien que inicial- 
mente use la marca A puede terminar usando la marca B dos meses después en dos for- 
mas diferentes (marcadas * en la figura): la persona puede seguir usando A después de 1 
mes y luego cambiar a B (con probabilidad 0.7(0.3) = 0.21), o la persona puede cambiar 
a B después de 1 mes y luego seguir con B (con probabilidad 0.3(0.8) = 0.24). La suma 
de estas probabilidades produce una probabilidad global de 0.45. Observe que dichos 
cálculos son exactamente lo que se hizo cuando se calculó (P?),,. 

Se tiene que (P?),, = 0.45 representa la probabilidad de moverse del estado 1 (marca 
A) al estado 2 (marca B) en dos transiciones. (Note que el orden de los subíndices es el 
inverso del que pudo suponer.) El argumento puede generalizarse para demostrar que 


(PB), es la probabilidad de moverse del estado j al estado ¡en k transiciones. 


En el ejemplo 3.64, ¿qué sucederá con la distribución de usuarios de dentífrico a 
largo plazo? Trabaje con vectores de probabilidad como vectores de estado. Al continuar 
con los cálculos (redondeados a tres lugares decimales), se encuentra 


[e iS al es oo de s 
Xo = X; X, = PX = = 7 
0.40 0.50 0.30 0.80 J| 0.50 0.55 
0.70 0.20][0.45 0.425 0.412 0.406 
xX, = Px, = X4 X5 > 
0.30 0.80 ]|10.55 0.575 0.588 0.594 


pao e cp foam, uo] 
X = > 
$” [0.597 7 7 l0.598 1% | 0.5991 7 | 0.600 7 | 0.600 
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; 0.4 
etcétera. Parece que los vectores de estado tienden (o convergen a) el vector f T lo 


que implica que, a la larga, 40% de los usuarios de dentífrico en el estudio usarán la 
marca A y 60% usarán la marca B. De hecho, es fácil comprobar que, una vez alcanzada 
esta distribución, nunca cambiará. Simplemente calcule 


ba al o E Dl 
0.30 0.80 || 0.6 0.6 

Un vector de estado x con la propiedad de que Px = x se llama vector de estado es- 
tacionario. En el capítulo 4 se probará que toda cadena de Markov tiene un vector de es- 
tado estacionario único. Por ahora, acepte esto como un hecho y vea cómo puede en- 
contrar tal vector sin hacer iteración alguna. 

Comience por reescribir la ecuación matricial Px = x como Px = Ix, que a su vez 
puede reescribirse como (1 — P)x = 0. Ahora, esto es justo un sistema homogéneo de 
ecuaciones lineales con matriz de coeficientes I — P, de modo que la matriz aumentada 
es [I — P/0]. En el ejemplo 3.64 se tiene 

] 
0 


1 — 0.70  —0.20 j =| 0.30 —0.20 
—0.30  1—0.80|0 —0.30 0.20 


| 


que se reduce a 


: : x X : 
De modo que, si el vector de estado estacionario es x = | Í entonces x, es una varia- 
: > e x 
ble libre y la solución paramétrica es 2 


= 2 = 
x= =t 


Si se requiere que x sea un vector de probabilidad, entonces debe tener 


l=x+xo=3t+t=3t 
3 2 0.4 . 
Por tanto, x, = t = 5 = 0.6 y x, = 5 = 0.4, de modo que x = 06 | en concordancia 
con los anteriores cálculos iterativos. (Si requiere que x contenga la distribución real, 


: f 80 
entonces en este ejemplo debe tener x, + x, = 200, de donde se tiene que x = | a 


z= 
Un psicólogo coloca una rata en una jaula con tres compartimentos, como se muestra en 
la figura 3.21. La rata fue entrenada para seleccionar una puerta al azar siempre que 
suene una campana y moverse a través de ella hacia el siguiente compartimento. 


(a) Si inicialmente la rata está en el compartimiento 1, ¿cuál es la probabilidad de que es- 
tará en el compartimiento 2 después de que la campana suene dos veces? ¿Tres veces? 


(b) A largo plazo, ¿qué proporción de su tiempo pasará la rata en cada compartimiento? 


Solución Sea P = [p;] la matriz de transición para esta cadena de Markov. Entonces 


Pa = Pa J Pu = Pis eN P32 = Pa a Y Pu = Pa = P3 = 0 


240 


Capítulo 3 Matrices 


Figura 3.21 


(¿Por qué? Recuerde que p; es la probabilidad de moverse de j a i.) Por tanto 


© 


gs 

II 
ie nia 
vin O le 
O WIN wie 


y el vector de estado inicial es 


1 
Xx =|0 
0 
(a) Después de un campanazo, se tiene 
o 3 3]/1 0 0 
x=Px=|2 0 3|[0|=|2|=|05 
2 2 eLo z 0.5 


Al continuar (redondeado a tres lugares decimales), se encuentra 


o 3 i]fo z 0.333 
x=Px=|3 0 3|(3|=|3|=| 0.333 
2 2 0JL3 z 0.333 
y 
E s 0.222 
x=Px=|3 0 ¿[|3|=|%4|=|0.389 
2 2 ojl; E 0.389 


Por tanto, después de dos campanazos, la probabilidad de que la rata esté en el compar- 
timiento 2 es į = 0.333, y después de tres campanazos, la probabilidad de que la rata esté 
en el compartimiento 2 es ïg = 0.389. [Note que estas preguntas también podrían res- 
ponderse al calcular (P?) ,, y (2) ,,.] 


Sección 3.7 Aplicaciones 241 


(b) Esta pregunta pide el vector de estado estacionario x como un vector de probabili- 
dad. Como se vio anteriormente, x debe estar en el espacio nulo de I — P, de modo que 
se procede a resolver el sistema 


L =; =,10 1 0 -—5|0 
H-P|o]=|-} 1 —¿jo|—>|0 1 -ılo 
—} 2  1|0 o 0 ojo 
Xı 
Por tanto, si x = | x |, entonces x, = t es libre y x, = ¿t, x, = t. Dado que x debe ser 
X3 


un vector de probabilidad, se necesita 1 = x, + x, + x, = $t. En consecuencia, t = $ y 


> 
II 


lo cual dice que, a largo plazo, la rata pasa $ de su tiempo en el compartimiento 1 y ¿ de 
su tiempo en cada uno de los otros dos compartimientos. 


Ahora se visitarán nuevamente los modelos económicos que se encontraron por pri- 
mera vez en la sección 2.4 y se reformularán en términos de matrices. El ejemplo 2.33 
ilustró el modelo cerrado de Leontief. El sistema de ecuaciones que debió resolverse fue 


1 1 1 = 
104 3%+ 3% = X 
1 1 ¡A 
1 + 3%, 3% = X 
1 1 1 = 
3% t3% Eg = 2 


En forma matricial, esta es la ecuación Ex = x, donde 


1/4 1/3 1/2 xı 
E=|1/4 1/3 1/⁄4|yx=ļ|x 
1/2 1/3 1/4 x; 


La matriz E se llama matriz de intercambio y el vector x se llama vector de precio. En ge- 
neral, si E = [e; ], entonces e; representa la fracción (o porcentaje) de output de la in- 
dustria j que consume la industria i, y x; es el precio que cobra la industria i por su out- 
put. 

En una economía cerrada, la suma de cada columna de E es 1. Dado que las entradas 
de E también son no negativas, E es una matriz estocástica y el problema de encontrar 
una solución a la ecuación 


Ex=x (1) 


¡es precisamente el mismo que el problema de encontrar el vector de estado estacionario 
de una cadena de Markov! Por tanto, para encontrar un vector precio x que satisfaga 
Ex = x, se resuelve la ecuación homogénea equivalente (I — E)x = 0. Siempre existirá 
un número infinito de soluciones; se busca una solución donde los precios sean todos no 
negativos y al menos un precio sea positivo. 
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El modelo abierto de Leontief es más interesante. En el ejemplo 2.34 fue necesario resol- 
ver el sistema 


x= 0.2x, + 0.5x, + 0.1x, + 10 
x,= 0.4x, + 0.2x, + 0.2x, + 10 
x= 0.1x, + 0.3x, + 0.3x, + 30 


En forma matricial, se tiene 


x=Cx+d o (I1-Cix=d (2) 
donde 
0.2 0.5 0.1 xı 10 
c=l04 02 02|x=|x | d=|10 
0.1 0.3 0.3 x; 30 


La matriz C se llama matriz de consumo, x es el vector de producción, y d es el vector de 
demanda. En general, si C = [c;; ], x= [x;], y d = [d;], entonces c, representa el valor en 
dólares del output de la industria i que se necesita para producir un dólar de output de 
la industria j, x; es el valor monetario (precio) del output de la industria i, y d; es el valor 
monetario de la demanda externa para el output de la industria i. Una vez más, se está 
interesado en encontrar un vector de producción x con entradas no negativas tales que 
al menos una entrada sea positiva. A tal vector x se le llama solución factible. 


=> 
Determine si existe una solución para modelo abierto de Leontief determinado por las 
siguientes matrices de consumo: 


1/4 A 


1/2 l 
1/2 1/3 


nes ls 2/3 


wc=| 


Solución (a) Se tiene 


oeli J-B E 


de modo que la ecuación (I — C)x = d se convierte en 


| 3/4 E ha] Ñ lea 
-1/2 2/3] Lx, d, 
En la práctica se reduciría por renglón la correspondiente matriz aumentada para deter- 


minar una solución. Sin embargo, en este caso es instructivo notar que la matriz de coe- 
ficientes I — C es invertible y entonces aplicar el Teorema 3.7. Se calcula 


allie zl Lal lse salla 
X -1/2 2/3] (a 3/2 9/41Ld, 
Dado que d,, d, y todas las entradas de (I — C)”* son no negativas, también lo son x, y 


x,. Por tanto, puede encontrarse una solución factible para cualquier vector de demanda 
distinto de cero. 
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(b) En este caso, 


de modo que 


x= (1- CJ d= E Ca 


Dado que todas las entradas de (I — C)! son negativas, esto no producirá una solución 
factible para cualquier vector de demanda distinto de cero d. | 


Motivada por el ejemplo 3.66, se tiene la siguiente definición. (Para dos matrices 
m X n; A = [a;] y B= [b;], se escribirá A = B si a; = b; para todo iy j. De igual modo, 
puede definirse A > B, A = B, etcétera. Una matriz A se llama no negativa si A = O y 
positiva si A > O.) 


Definición Una matriz de consumo C se llama productiva si I— C es invertible y 
(T= CON 


Ahora se dan tres resultados que proporcionan criterios para que una matriz de con- 
sumo sea productiva. 


Teorema 3.34 Sea C una matriz de consumo. Entonces C es productiva si y sólo si existe un vector 


de producción x = 0 tal que x > Cx. 


Demostración Suponga que C es productiva. Entonces I — C es invertible y 
(I — C) ' = O. Sea 


Entonces x = (I — C)`tj = 0 y (I — C)x = j > 0. Por tanto, x — Cx > 0 o, de ma- 
nera equivalente, x > Cx 

Por el contrario, suponga que existe un vector x = 0 tal que x > Cx. Dado que 
C = OyC + O,setienex > 0 por el ejercicio 35. Más aún, debe existir un número real A 
con0 < À < 1 tal que Cx < Ax. Pero entonces 


C?%x = C(Cx) = C(Ax) = A(Cx) < A(Ax) = Ax 


M=> Por inducción, puede demostrarse que 0 S C”x < )”x para toda n = 0. (Escriba los 
detalles de esta demostración por inducción.) Dado que 0 < À < 1, A” se aproxima a 0 
cuando n se vuelve grande. Por tanto, cuando n—>00,1"x—>0 y en consecuencia 
C"x > 0. Puesto que x > 0, debe tener C” > O cuando n > 00. 

Ahora considere la ecuación matricial 


1=-ODOU+C+ OR. +4CU0)=I-C” 
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Cuando n — 00, C” > O, así que se tiene 
=O POFRE A a Si Del 


Por tanto, I — C es invertible, con su inverso dado por la serie matricial infinita 
I+ C+ CŒ + .... Dado que todos los términos en esta serie son no negativos, también 
se tiene 


=C SIISE 0 


En consecuencia, C es productiva. 


Comentarios 

e  Laserieinfinital + C + Œ + ... esel análogo matricial de la serie geométrica 
1+x+x + ..... Es posible que el lector esté familiarizado con el hecho de que, para 
[E AR o AL x). 


+ Dado que el vector Cx representa las cantidades consumidas por cada industria, 
la desigualdad x > Cx significa que existe cierto nivel de producción para el cual cada 
industria produce más de lo que consume. 

+ Para un planteamiento alternativo a la primera parte de la demostración del Teo- 
rema 3.34, vea el ejercicio 42 de la sección 4.6. 


COROLARIO 3.35 


La palabra corolario proviene de la 
palabra latina corollarium, que se 
refiere a una guirnalda otorgada 
como recompensa. Por tanto, un 
corolario es una pequeña recom- 
pensa adicional que se tiene de un 
teorema. 


Sea C una matriz de consumo. Si la suma de cada renglón de C es menor que 1, en- 
tonces C es productiva. 


Demostración Si 1 


>< 
II 


1 


entonces Cx es un vector que consiste de las sumas de renglón de C. Si cada suma de ren- 
glón de C es menor que 1, entonces se satisface la condición x > Cx. Por tanto, C es pro- 
ductiva. 


COROLARIO 3.36 


Sea C una matriz de consumo. Si la suma de cada columna de C es menor que 1, en- 
tonces C es productiva. 


Demostración Si cada suma de columna de C es menor que 1, entonces cada suma de 
columna de C” es menor que 1. Por tanto, C" es productiva, por el Corolario 3.35. En 
consecuencia, por los Teoremas 3.9(d) y 3.4, 


-0> = (0-0) =(P-C0)*=U1-C0)*=0 


Se tiene que (I — C)™! = O también y, por tanto, C es productiva. 

En el ejercicio 52 de la sección 7.2 se le pedirá dar demostraciones alternativas a los 
Corolarios 3.35 y 3.36. 

De la definición de matriz de consumo se tiene que la suma de la columna j es el 
valor monetario total de todas las entradas necesarias para producir un importe mone- 
tario de la output de la industria j; esto es, el ingreso de la industria j supera sus gastos. 
Se dice que tal industria es rentable. En consecuencia, el Corolario 3.36 puede parafra- 
searse para enunciar que una matriz de consumo es productiva si todas las industrias 
son rentables. 


P. H. Lewis, “On the Use of Matri- 
ces en Certain Population Mathe- 
matics”, Biometrika 33 (1945), pp. 
183-212. 
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Uno de los modelos más populares de crecimiento poblacional es uno basado en matri- 
ces, introducido por primera vez por P. H. Leslie en 1945. El modelo de Leslie describe el 
crecimiento de la porción femenina de una población, la cual se supone tiene una vida 
máxima. Las hembras se dividen en clases etáreas (por edades), todas las cuales abarcan 
un número igual de años. Con datos acerca de las tasas de natalidad promedio y proba- 
bilidades de supervivencia de cada clase, el modelo es capaz de determinar el creci- 
miento de la población a lo largo del tiempo. 


Ejemplo 3.67 


=> 
Cierta especie de escarabajo alemán, llamado de Vollmar-Wasserman (o escarabajo VW, 
para abreviar), vive cuando mucho 3 años. Las hembras del escarabajo VW se dividen en 
tres clases etáreas de 1 año cada una: jóvenes (0-1 año), juveniles (1-2 años) y adultas (2- 
3 años). Las jóvenes no ponen huevos; cada juvenil produce un promedio de cuatro es- 
carabajos hembras; y cada adulta produce un promedio de tres hembras. 

La tasa de supervivencia para jóvenes es 50% (esto es: la probabilidad de que una 
joven sobreviva hasta volverse juvenil es 0.5), y la tasa de supervivencia de las juveniles es 
25%. Suponga que comienza con una población de 100 escarabajos VW hembras: 40 jó- 
venes, 40 juveniles y 20 adultas. Prediga la población de escarabajos para cada uno de los 
siguientes 5 años. 


Solución Después de 1 año, el número de jóvenes será el número producido durante 
dicho año: 
40 X 4 + 20 X 3 = 220 


El número de juveniles simplemente será el número de jóvenes que sobrevivió: 


40 x 0.5 = 20 
Del mismo modo, el número de adultas será el número de juveniles que sobrevivió: 
40 X 0.25 = 10 
Puede combinar esto en una sola ecuación matricial 
0 4 3 [| 40 220 
0.5 0 0||40|=| 20 
0 0.25 0JL20 10 
40 
o Lx, = X, donde Xx, =| 40 |es el vector de distribución de población inicial y x; 
20 
220 
=| 20 | es la distribución después de 1 año. Se ve que la estructura de la ecuación es 
10 


exactamente igual que la de las cadenas de Markov: Xx, ,, = Ex, para k = 0, 1, 2, . . . (aun- 
que la interpretación es bastante diferente). Se tiene que es posible calcular por iteración 
vectores de distribución de población sucesivos. (También se tiene que x, = Lx, para k = 


0,1,2,..., como para las cadenas de Markov, pero aquí no se usará este hecho.) 
Calcule 

0 4 3 || 220 110 
x=I!Ix=|05 0 0 20|=|110 

0 0.25 0 10 5 

0 4 3||110 455 
x=Ix=|05 0 0||110|=| 55 

0 0.25 0 5 27.5 
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0 4 371455 302.5 

x=Ix=|05 0  0|| 55 |=|227.5 
o 0.25 OJl 27.5 13.75 
o 4 37[3025 951.2 

x =x =]|0.5 0 alas |= | 1512 
o 0.25 OJL 13.75 56.88 


Por tanto, el modelo predice que, después de 5 años, habrá aproximadamente 951 
hembras jóvenes de escarabajo VW, 151 juveniles y 57 adultas. (Nota: podría argumen- 
tar que en cada paso habría que redondear al entero más cercano, por ejemplo, 28 adul- 
tos después del paso 3, lo que afectaría las iteraciones posteriores. Se eligió no hacer esto, 
pues, de cualquier forma, los cálculos sólo son aproximaciones y es mucho más fácil usar 
una calculadora o CAS si no redondea conforme avanza.) 4 


La matriz L en el ejemplo 3.67 se llama matriz de Leslie. En general, si se tiene una 
población con n clases etáreas de igual duración, L será una matriz de n X n con la si- 
guiente estructura: 


b b, b; b br: b, 

s 0 0 += 0 0 

0 os 0 e 0 0 
L= 

0 0 s 0 0 

0 0 0 == 3. Q 


Aquí, b,, b», . . . son los parámetros de natalidad (b, = número promedio de hembras pro- 
ducidas por cada hembra en la clase 1) y s}, s» . . . son las probabilidades de supervivencia 
(s; = probabilidad de que una hembra en la clase i sobreviva en la clase i + 1). 

¿Qué se hará con los cálculos? En general, la población de escarabajos parece au- 
mentar, aunque existen algunas fluctuaciones, como una disminución de 250 a 225 del 
año 1 al año 2. La figura 3.22 muestra el cambio en la población en cada una de las tres 
clases etáreas y claramente muestra el crecimiento, con fluctuaciones. 


A 
al Jóvenes 
= 3000 + 
ya 
3 Juveniles 
8 2000 + 
A 
1000 F 
Adultas 


Tiempo (en años) 


Figura 3.22 
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Jóvenes 


Porcentaje de población 


0.3 + Juveniles 


0 | | | | > 
0 5 10 15 20 
Tiempo (en años) 


Figura 3.23 


Si, en lugar de graficar la población real se grafica la población relativa en cada clase, 
surge un patrón diferente. Para hacer esto, es necesario calcular la fracción de la pobla- 
ción en cada clase etárea en cada año; esto es, es necesario dividir cada vector de distri- 
bución por la suma de sus componentes. Por ejemplo, después de 1 año, se tiene 


i , [220 0.88 
x = 20 | = | 0.08 

250 250 
10 0.04 


la cual dice que 88% de la población consiste de jóvenes, 8% de juveniles y 4% de adul- 
tas. Si este tipo de datos se grafican contra el tiempo, se obtiene una gráfica como la de la 
figura 3.23, que muestra claramente que la proporción de la población en cada clase se 
aproxima a un estado estable. Se evidencia que el vector de estado estacionario en este 
ejemplo es 


0.72 
0.24 
0.04 


Esto es, a largo plazo, 72% de la población será de jóvenes, 24% de juveniles y 4% de 
adultas. (En otras palabras, la población se distribuye entre las tres clases etáreas en la 
razón 18 : 6 : 1.) En el capítulo 4 se verá cómo determinar esta razón con exactitud. 


Grafos y digrafos 


Existen muchas situaciones en las que es importante poder modelar las interrelaciones 
entre un conjunto finito de objetos. Por ejemplo, acaso quiera describir varios tipos de 
redes (carreteras que conectan ciudades, rutas de aerolíneas que conectan ciudades, ligas 
de comunicación que conectan satélites, etcétera) o relaciones entre grupos o individuos 
(relaciones de amistad en una sociedad, relaciones depredador-presa en un ecosistema, 
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A B 
C D 
A B C D 
Figura 3.24 


Dos representaciones del mismo 
grafo 


El término vértice viene del verbo 
latino vertere, que significa “vol- 
ver”. En el contexto de los grafos (y 
la geometría), un vértice es una es- 
quina, un punto donde una arista 
« » > 

se vuelve” una arista diferente. 


relaciones de dominio en un deporte, etcétera). Los grafos son idealmente adecuados 
para modelar tales redes y relaciones, y es evidente que las matrices son una herramienta 
útil en su estudio. 

Un grafo consiste de un conjunto finito de puntos (llamados vértices) y un conjunto 
finito de aristas, cada una de las cuales conecta dos vértices (no necesariamente distin- 
tos). Se dice que dos vértices son adyacentes si son los puntos finales de una arista. La fi- 
gura 3.24 muestra un ejemplo del mismo grafo dibujado en dos formas diferentes. Los 
grafos son “iguales” en el sentido de que todo por lo que debe preocuparse es por las re- 
laciones de adyacencia que identifican las aristas. 

Es posible registrar la información esencial acerca de un grafo en una matriz y usar 
álgebra matricial para ayudar a responder ciertas preguntas acerca del grafo. Esto es par- 
ticularmente útil si los grafos son grandes, pues las computadoras pueden manejar los 
cálculos muy rápidamente. 


Definición SiG es un grafo con n vértices, entonces su matriz de adyacencia es 


la matriz A [o A(G)] de n X n definida por 


1 si existe una arista entre los vértices 1 y j 


A: 
á O de otro modo 


La figura 3.25 muestra un grafo y su matriz de adyacencia asociada. 


TS 


0 1 1 1 
1 100 
A= 
1 1 0 0 
1 0 0 0 
V4 V3 
Figura 3.25 


Un grafo con matriz de adyacencia A 


Comentario Observe que la matriz de adyacencia de un grafo necesariamente es 
una matriz simétrica. (¿Por qué?) Note también que una entrada diagonal a,, de A es cero 
a menos que haya un bucle en el vértice i. En algunas situaciones, un grafo puede tener 
más de una arista entre un par de vértices. En tales casos, puede tener sentido modificar 
la definición de la matriz de adyacencia de modo que a, sea igual al número de aristas 
entre los vértices 1 y j. 


Una trayectoria en un grafo es una secuencia de aristas que permiten viajar de un 
vértice a otro de manera continua. La longitud de una trayectoria es el número de aris- 
tas que contiene, y a una trayectoria con k aristas se le denominará k-trayectoria. Por 
ejemplo, en el grafo de la figura 3.25, v,v,v,v, es una 3-trayectoria, y v,¿V,V,V,V,v, es una 
5-trayectoria. Note que la primera de éstas es cerrada (comienza y termina en el mismo 
vértice); a tal trayectoria se le llama circuito. La segunda usa las aristas entre v, y v, dos 
veces; una trayectoria que no incluye la misma arista más de una vez se llama trayectoria 
simple. 
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Es posible usar las potencias de la matriz de adyacencia de un grafo para obtener in- 
formación acerca de las trayectorias de varias longitudes en el grafo. Considere el cua- 
drado de la matriz de adyacencia en la figura 3.25: 


3 
2 
1 
0 


A = 


RF N U N 
= N N =e 
Rh = =e O 


¿Qué representan las entradas de A”? Observe la entrada (2, 3). A partir de la definición 
de multiplicación matricial, se sabe que 


2 — 
(A Jz = 431413 + 4743 + 073433 + 0043 


La única manera en que esta expresión puede resultar en un número distinto de cero es 
si al menos uno de los productos a,,a,, que constituyen la suma es distinto de cero. Pero 
a,4,, es distinto de cero si y sólo si tanto a,, como a, son distintos de cero, lo que signi- 
fica que hay una arista entre v, y Vp así como una arista entre v, y V3. Por tanto, habrá una 
2-trayectoria entre los vértices 2 y 3 (vía el vértice k). En el ejemplo, esto ocurre para k = 
1 y para k = 2, de modo que 


(as = 0,1413 + 0,43 + 0,3433 + 074043 
1:-1+1-1+1:-0+0-+0 
=2 


la cual dice que hay dos 2-trayectorias entre los vértices 2 y 3. (Compruebe para ver que 
las entradas restantes de A? correctamente dan 2-trayectorias en el grafo.) El argumento 
que acaba de darse puede generalizarse para producir el siguiente resultado, cuya de- 
mostración se deja como ejercicio 72. 


Si A es la matriz de adyacencia de un grafo G, entonces la entrada (i, j) de A* es igual 
al número de k-trayectorias entre los vértices 1 y j. 


vi va 
> 
> 
V4 Y3 
Figura 3.26 
Un digrafo 


¿Cuántas 3-trayectorias hay entre v, y v, en la figura 3.25? 


Solución Se necesita la entrada (1, 2) de A*, que es el producto punto del renglón 1 de 


A? y la columna 2 de A. El cálculo produce 


(4), =3-1+2+1+1:1+0:0=6 


de modo que hay seis 3-trayectorias entre los vértices 1 y 2, lo que puede comprobarse 


con facilidad. 


En muchas aplicaciones que pueden modelarse mediante un grafo, los vértices se or- 
denan mediante algún tipo de relación que impone una dirección a las aristas. Por ejem- 
plo, las aristas dirigidas pueden usarse para representar rutas de una vía en un grafo que 
modela una red de transporte o relaciones depredador-presa en un grafo que modela un 
ecosistema. Un grafo con aristas dirigidas se llama digrafo. La figura 3.26 muestra un ejem- 
plo. 

Una sencilla modificación de la definición de las matrices de adyacencia permite 
usarlas con digrafos. 
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Definición Si Ges un digrafo con n vértices, entonces su matriz de adyacencia 
es la matriz A [o A(G)] de n X n definida por 


; si existe una arista del vértice í al vértice j 
y 


O de otro modo 


Por tanto, la matriz de adyacencia para el digrafo en la figura 3.26 es 


e =oo 
ooon 
.=oo0oo 
ooms 


No es de sorprender que la matriz de adyacencia de un digrafo no sea simétrica en gene- 
ral. (¿Cuándo lo sería?) El lector no debe tener dificultad para ver que A* ahora contiene 
los números de k-trayectorias dirigidas entre vértices, donde se insiste que todas las aris- 
tas a lo largo de una trayectoria fluyen en la misma dirección. (Vea el ejercicio 72.) El si- 
guiente ejemplo ofrece una aplicación de esta idea. 


> 


R 
Figura 3.27 


Un torneo 


Cinco tenistas (Djokovic, Federer, Nadal, Roddick y Safin) compiten en un torneo con el 
sistema round-robin en el que cada jugador compite con todos los demás una vez. El di- 
grafo en la figura 3.27 resume los resultados. Una arista dirigida del vértice i al vértice j 
significa que el jugador i venció al jugador j. (Un digrafo en el que existe exactamente 
una arista dirigida entre cada par de vértices se llama torneo.) 

La matriz de adyacencia para el digrafo de la figura 3.27 es 


> 
II 
O oroo 
O oOo O O me 
H O Q H © 
O Omme 
Oboe 


donde el orden de los vértices (y por tanto, los renglones y columnas de A) se determina 
alfabéticamente. Por tanto, Federer corresponde a renglón 2 y columna 2, por ejemplo. 

Suponga que se quiere clasificar a los cinco jugadores con base en los resultados de 
sus partidos. Una forma de hacer esto puede ser contar el número de triunfos de cada ju- 
gador. Observe que el número de triunfos de cada jugador es justo la suma de las entra- 
das en el renglón correspondiente; de manera equivalente, el vector que contiene todas 
las sumas de renglón está dado por el producto Aj, donde 


Næ 
II 
Rh =. e - _- 
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En este caso se tiene 


o 1.0 1 1][1 3 
0.0 1 1 1|[|1 3 
G=|1 06.010 1|=|2 
0.0.0.0 1||1 1 
o 0 1.0 oju] u 


que produce la siguiente clasificación: 


Primero: Djokovic, Federer (empatados) 
Segundo: Nadal 
Tercero: Roddick, Safin (empatados) 


¿Los jugadores empatados en esta clasificación son igualmente fuertes? Djokovic 
puede argumentar que, puesto que venció a Federer, él merece el primer lugar. Roddick 
usaría el mismo tipo de argumento para romper el empate con Safin. Sin embargo, Safin 
podría argumentar que él tiene dos victorias “indirectas” porque venció a Nadal, quien 
venció a otros dos; más aún, él puede puntualizar que Roddick sólo tiene una victoria in- 
directa (sobre Safin, quien venció a Nadal). 

Dado que en un grupo de empates puede no haber un jugador que venciera a todos 
los demás en el grupo, la notación de victorias indirectas parece más útil. Más aún, una 
victoria indirecta corresponde a una 2-trayectoria en el digrafo, de modo que puede usar 
el cuadrado de la matriz de adyacencia. Para calcular tanto los triunfos como las victo- 
rias indirectas para cada jugador, se necesitan las sumas de renglón de la matriz A + A?, 
que están dadas por 


0.1.0 1 1 0 0 2 1 2|[1/1 
0 0 1 1 1 161311 11 
(A+ ADj=||1 0 0 1 O|+|0 1 0 1 2 1 
0 0 0 0 1 0 0 1 0 ojfj1 
00100 1 0 0 1 0j/|1 
0 122 3||1 8 
1.0.2 2 211 7 
=|1 1 0 2 2||1|=|6 
0 0 10 1|[|1 2 
1 0 1 1 OJ|1 3 


En consecuencia, los jugadores se clasificarían en el siguiente orden: Djokovic, Federer, 
Nadal, Safin, Roddick. Por desgracia, este planteamiento no garantiza romper todos los 


empates. 


En la sección 1.4 se estudiaron ejemplos de códigos de detección de error. Ahora se 
aborda el problema de diseñar códigos que puedan corregir así como detectar ciertos 
tipos de errores. El mensaje será un vector x en Z! para alguna k, y se le codificará usando 
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una transformación matricial T : Z$ > Z} para algún n > k. El vector T(x) se llamará 
vector código. Un ejemplo simple servirá para ilustrar el enfoque a tomar, que es una ge- 
neralización de los vectores de control de paridad del ejemplo 1.37. 


Ejemplo 3.70 


> 
Suponga que el mensaje es un solo dígito binario: 0 o 1. Si el mensaje se codifica al sim- 
plemente repetirlo dos veces, entonces los vectores código son [0, 0] y [1, 1]. Este código 
puede detectar errores individuales. Por ejemplo, si se transmite [0, 0] y ocurre un error 
en el primer componente, entonces se recibe [1, 0] y se detecta un error, porque este no 
es un vector código legal. Sin embargo, el receptor no puede corregir el error, pues [1, 0] 
también sería resultado de un error en el segundo componente si se hubiese transmitido 
[1, 1]. 

Este problema se puede resolver al hacer los vectores código más largos: repetir el dí- 
gito de mensaje tres veces en lugar de dos. Por tanto, 0 y 1 se codifican como [0, 0, 0] y 
[1, 1, 1], respectivamente. Ahora, si ocurre un solo error, no sólo se puede detectar, sino 
también corregir. Por ejemplo, si se recibe [0, 1, 0], entonces se sabe que debe ser el re- 
sultado de un solo error en la transmisión de [0, 0, 0], pues un solo error en [1, 1, 1] no 


se habría producido. 


Note que el código en el ejemplo 3.70 puede lograrse mediante una transformación 
1 
matricial, aunque en una particularmente trivial. Sea G = | 1 | y defina T : Z, > Z 
1 
mediante T(x) = Gx. (Aquí los elementos de Z, se consideran matrices de 1 X 1.) La 
matriz G se llama matriz generadora del código. 
Para decir si un vector recibido es un vector código, se realiza no una, sino dos 
al 
comprobaciones de paridad. Se requiere que el vector recibido c = | c, | satisfaga c, = c, 
6 


= çc. Estas ecuaciones pueden escribirse como un sistema lineal sobre Z.: 


Cc =C) 6 Gi + C) =0 0 


01 =(; Ci +0c6=0 


1 


Lo | entonces (1) es equivalente a Pc = 0. La matriz P se llama 


Si se hace P = | 
0 
matriz de control de paridad para el código. Observe que PG = H =0. 


Para ver cómo estas matrices entran en juego para la corrección de errores, suponga 
1 
que se envía 1 como | 1 | = [1 1  1]% pero un solo error hace que se reciba como 
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c'=[1 0 1]. Se calcula 


de modo que se sabe que c' no puede ser un vector código. ¿Dónde está el error? Note 
que Pc’ es la segunda columna de la matriz de control de paridad P; ésta dice que el error 
está en el segundo componente de c' (lo que se probará adelante en el Teorema 3.37) y 
permite corregir el error. (Desde luego, en este ejemplo podría encontrar el error más rá- 
pidamente sin usar matrices, pero la idea es útil.) 

Para generalizar las ideas en el último ejemplo, se hacen las siguientes definiciones. 


Definiciones si k < n, entonces cualquier matriz de n X k de la forma 
I 
G = E donde A es una matriz de (n — k) X k sobre Z,, se llama matriz genera- 


dora estándar para un código binario (n, k) T : Z$ — Z}. Cualquier matriz de (n — 
k) X n de la forma P = [B I,,_,], donde B es una matriz de (n — k) X k sobre Z,, se 
llama matriz de comprobación de paridad estándar. Se dice que el código tiene lon- 
gitud n y dimensión k. 


He aquí lo que se necesita saber: (a) ¿Cuándo es G la matriz generadora estándar 
para un código binario de corrección de error? (b) Dada G, ¿cómo se encuentra una ma- 
triz de control de paridad estándar asociada P? Es evidente que las respuestas son bas- 
tante sencillas, como se muestra mediante el siguiente teorema. 


Teorema 3.37 


Ejemplo 3.71 


I i 
Si G = E es una matriz generadora estándar y P = [B I,_;] es una matriz de 


control de paridad estándar, entonces P es la matriz de control de paridad asociada 
con G, si y sólo si A = B. El correspondiente código binario (n, k) es de corrección de 
error (sencillo) si y sólo si las columnas de P son distintas de cero y diferentes. 


Antes de demostrar el teorema, considere otro ejemplo menos trivial que lo ilustra. 


Suponga que quiere diseñar un código de corrección de error que use tres ecuaciones de 
control de paridad. Dado que dichas ecuaciones dan lugar a los renglones de P, se tiene 
n—k=3yk=mn-— 3.Los vectores de mensaje vienen de Z£, así que se buscaría que k (y 
por tanto n) fuese tan largo como sea posible, con la finalidad de poder transmitir tanta 
información como sea posible. Por el Teorema 3.37, las n columnas de P deben ser dis- 
tintas de cero y diferentes así que el máximo ocurre cuando ellas consisten de todos los 
2% - 1 = 7 vectores distintos de cero de Z!”*= Z3, Uno de tales candidatos es 


1101100 
P=|1 0 1 1 0 1 0 
O 1 1 1 0O 0 1I 
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Esto significa que 


Q 
II 
O m.m. OOO 
= O = O O m. O 
Rh p S O a a 
= =- =e - O O O 


Como ejemplo de cómo funciona la matriz generadora, suponga que se codifica x = 
[o 1 0 1J" para obtener el vector código 


c=Gx=[0 1 0 1 0 1 of 


Si se recibe este vector, se ve que es correcto, pues Pc = 0. Por otra parte, si se recibe 
c =[0 1 1 1 0 1 0] secalcula 


0 

1 
110.110 0]||1 0 
Pe =|10.1.1010/|1|[=]|1 
0O 1 1 1 0 O 1j/0 1 

1 

0 


que se reconoce como la columna 3 de P. Por tanto, el error está en el tercer componente 
de c', y al cambiarlo se recupera el vector código correcto c. También se sabe que los pri- 
meros cuatro componentes de un vector código son el vector mensaje original, así que 
en este caso se decodifica c para obtener el originalx = [0 1 0 1f. 


El código del ejemplo 3.71 se llama código de Hamming (7, 4). Cualquier código bi- 

nario construido de esta forma se llama código de Hamming (n, k). Observe que, por 
construcción, un código de Hamming (n, k) tiene n = 2k], 
Demostración del Teorema 3.37 (A lo largo de esta demostración se denota mediante a, 
la i-ésima columna de una matriz A.) Con P y G como en el enunciado del teorema, pri- 
mero suponga que son matrices de control de paridad estándar y generadora para el 
mismo código binario. Por tanto, para toda x en Z*, PGx = 0. En términos de multipli- 
cación de bloques, 


I 
[B MS para toda x en Z% 


Richard W. Hamming (1915-1998) 
recibió su doctorado en 
matemáticas de la Universidad de 
Illinois en Urbana-Champaign en 
1942. Sus intereses de investigación 
en matemáticas fueron los campos 
de las ecuaciones diferenciales y el 
análisis numérico. De 1946 a 1976, 
trabajó en los Laboratorios Bell, 
luego de lo cual se unió al cuerpo 
docente en la Escuela de 
Posgraduados Navales de Estados 
Unidos, en Monterey, California. En 
1950 publicó su ensayo fundamental 
acerca de los códigos de corrección 
de errores, lo que proporcionó una 
construcción explícita para los 
códigos óptimos que Claude 
Shannon probó teóricamente 
posibles en 1948. 
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De manera equivalente, para toda x en TE se tiene 


Bx + Ax = (B + A)x = (BI + IA)x = [B nik- 0 


o Bx = Ax 


Si ahora toma x = e, el i-ésimo vector base estándar en Z$, se ve que 
b; = Be; = Ae; = a; para toda i 


Por tanto, B = A. 

Por el contrario, es fácil comprobar que si B = A, entonces PGx = 0 para toda x en Z§ 
(vea el ejercicio 92). 

Para ver que tal par determina un código de corrección de error si las columnas de P 
son distintas de cero y diferentes, sea x un vector mensaje en Z! y sea el correspondiente 
vector código c = Gx. Entonces Pc = 0. Suponga que hay un error en el ¡-ésimo compo- 
nente, que resulta en el vector c’. Se tiene que c' = c + e, Ahora calcule 


Pc' = P(c + ej) = Pc + Pe; = 0 + p¡=Pp; 


que localiza el error en el ¡-ésimo componente. 

Por otra parte, si p; = 0, entonces un error en el 1-ésimo componente no se detectará 
(es decir, Pc' = 0), y si p; = p; entonces no se puede determinar si ocurrió un error en 
el i-ésimo o el j-ésimo componente (ejercicio 93). 


A continuación se resumen las ideas principales de esta sección. 


1. Para n > k, una matriz G de n X k y una matriz P de (n — k) X n (con entradas 
en Z,) son una matriz generadora estándar y una matriz de control de paridad es- 
tándar, respectivamente, para un código binario (n, k) si y sólo si, en forma de 
bloque, 


para alguna matriz A de (n — k) X k sobre Z,. 

2. G codifica un vector mensaje x en Z como un vector código c en Z} vía c = Gx. 

3. G es de corrección de error si y sólo si las columnas de P son distintas de cero y 
diferentes. Un vector c' en Z$ es un vector código si y sólo si Pc’ = 0. En este caso, 
el correspondiente vector mensaje es el vector x en Z$ que consiste de los prime- 
ros k componentes de c'. Si Pc’ + 0, entonces c' no es un vector código y Pc' es 
una de las columnas de P. Si Pc’ es la ¡-ésima columna de P, entonces el error está 
en el i-ésimo componente de c' y se puede recuperar el vector código correcto 
(y en consecuencia el mensaje) al cambiar este componente. 
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Ejercicios 3.1 


Y 


0.5 0.3 
| la matriz de 


En los ejercicios 1-4, sea P = 
0.5 0.7 


transición para una cadena de Markov con dos estados. Sea 


0.5 
Xo = el vector de estado inicial para la población. 
0.5 


1. Calcule x, y x,. 


2. ¿Qué proporción de la población del estado 1 estará en 
el estado 2 después de dos pasos? 


3. ¿Qué proporción de la población del estado 2 estará en 
el estado 2 después de dos pasos? 


4. Encuentre el vector de estado estacionario. 


En los ejercicios 5-8, sea P = la matriz de 


O Nie 
Gi wie la 
O Lin ula 


ia 


transición para una cadena de Markov con tres estados. Sea 
120 
Xo = | 180 | el vector de estado inicial para la población. 
90 


5. Calcule x, y x. 


6. ¿Qué proporción de la población del estado 1 estará en 
el estado 1 después de dos pasos? 


7. ¿Qué proporción de la población del estado 2 estará en 
el estado 3 después de dos pasos? 


8. Encuentre el vector de estado estacionario. 


9. Suponga que el clima en una región particular se com- 
porta de acuerdo con una cadena de Markov. Específica- 
mente, suponga que la probabilidad de que mañana será 
un día húmedo es de 0.662 si hoy es húmedo y de 0.250 
si hoy es seco. La probabilidad de que mañana sea un 
día seco es de 0.750 si hoy es seco y de 0.338 si hoy es 
húmedo. [Este ejercicio se basa en un estudio real de llu- 
vias en Tel Aviv durante un periodo de 27 años. Vea K. 
R. Gabriel y J. Neumann, “A Markov Chain Model for 
Daily Rainfall Occurrence at Tel Aviv”, Quarterly Journal 
of the Royal Meteorological Society, 88 (1962), pp. 90-95.] 
(a) Escriba la matriz de transición para esta cadena de 

Markov. 
(b) Si el lunes es un día seco, ¿cuál es la probabilidad de 
que el miércoles sea húmedo? 


(c) A largo plazo, ¿cuál será la distribución de días hú- 
medos y secos? 


10. Se han acumulado datos acerca de las estaturas de niños 
en relación con sus padres. Suponga que las probabili- 
dades de que un padre alto tenga un hijo alto, de me- 
diana estatura o bajo son 0.6, 0.2 y 0.2, respectivamente; 
las probabilidades de que un padre de talla media tenga 
un hijo alto, de estatura media o bajo son 0.1, 0.7 y 0.2, 
respectivamente; y las probabilidades de que un padre 
bajo tenga un hijo alto, mediano o bajo son 0.2, 0.4 y 
0.4, respectivamente. 

(a) Escriba la matriz de transición para esta cadena de 
Markov. 

(b) ¿Cuál es la probabilidad de que una persona baja 
tenga un nieto alto? 

(c) Si 20% de la población actual es alta, 50% es de es- 
tatura media y 30% es baja, ¿cuál será la distribu- 
ción en tres generaciones? 

(d) Si los datos del inciso (c) no cambian con el tiempo, 
¿qué proporción de la población será alta, de esta- 
tura mediana y baja a largo plazo? 


11. Un estudio de cultivos de pino piñonero en el sureste 
estadounidense, de 1940 a 1947, planteó la hipótesis que 
la producción de pinos seguía una cadena de Markov. 
[Vea D. H. Thomas, “A Computer Simulation Model of 
Great Basin Shoshonean Subsistence and Settlement 
Patterns”, en D. L. Clarke ed., Models in Archaeology 
(Londres: Methuen, 1972).] Los datos sugirieron que si 
la cosecha de un año era buena, entonces la probabilida- 
des de que el cultivo del siguiente año fuera bueno, ade- 
cuado o pobre eran de 0.08, 0.07 y 0.85, respectiva- 
mente; si la cosecha de un año era adecuada, entonces 
las probabilidades de que la cosecha del siguiente año 
fuera buena, adecuada y pobre eran de 0.09, 0.11 y 0.80, 
respectivamente; si la cosecha de un año era pobre, en- 
tonces las probabilidades de que la cosecha del siguiente 
año fuera buena, adecuada o pobre eran de 0.11, 0.05 y 
0.84, respectivamente. 

(a) Escriba la matriz de transición para esta cadena de 
Markov. 

(b) Si la cosecha de pino piñonero fue buena en 1940, 
encuentre las probabilidades de una buena cosecha 
en los años 1941 a 1945. 

(c) A largo plazo, ¿qué proporción de las cosechas será 
buena, adecuada y pobre? 


12. Se han programado robots para recorrer el laberinto 
que se muestra en la figura 3.28 y en cada unión eligen 
cuál camino seguir en forma aleatoria. 


13. 


14. (a) Demuestre que el producto de dos matrices estocás- 


Figura 3.28 


(a) Construya la matriz de transición para la cadena de 
Markov que modela esta situación. 

(b) Suponga que comienza con 15 robots en cada 
unión. Encuentre la distribución de estado estacio- 
nario de robots. (Suponga que a cada robot le toma 
la misma cantidad de tiempo recorrer la distancia 
entre dos uniones adyacentes.) 


Sea j un vector renglón que consiste por completo de 
números 1. Demuestre que una matriz P no negativa es 
una matriz estocástica si y sólo si jP = j. 


ticas de 2 X 2 también es una matriz estocástica. 
(b) Demuesrtre que el producto de dos matrices esto- 

cásticas de n X n también es una matriz estocástica. 
(c) Si una matriz estocástica P de 2 X 2 es invertible, 

demuestre que P”* también es una matriz estocás- 
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En los ejercicios 19-26, determine cuáles de las matrices son de 
intercambio. Para las que lo sean, encuentre un vector de pre- 
cio no negativo que satisfaga la ecuación (1). 


a a) 


0.1 o 
0.9 0.4 


1/2 0 2/3 


0.50 0.70 
0.25 0.30 
0.25 0 


0:35 
0.25 
0.40 


25.| 0.3 0.5 0.3 26. 


1/3 0 o0 1/2 1 0 
23.| 1/3 3/2 0 24.) 0 0 1/3 


En los ejercicios 27-30, determine si la matriz de consumo 
dada es productiva. 


0.20 0.10 0.10 
0.2 0.3 
27. 28. | 0.30 0.15 0.45 
0.5 0.6 
0.15 0.30 0.50 
0.2 04 01 04 
0.35 0.25 0 
0.3 0.2 0.2 0.1 
29. | 0.15 0.55 -0.35 30. 
0.4 0.5 0.3 
0.45 0.30 0.60 
0.5 0 0.2 0.2 


tica. 


Suponga que se quiere conocer el número promedio (o espe- 


rado) de pasos que se darán para ir del estado i al estado j en 


una cadena de Markov. Se puede demostrar que el siguiente 
cálculo responde esta pregunta: borre el renglón j-ésimo y la 
columna j-ésima de la matriz de transición P para obtener 


una nueva matriz Q. (Mantenga los renglones y columnas de 


Q etiquetadas como lo estaban en P.) El número esperado 
de pasos del estado i al estado j está dado por la suma de las 


En los ejercicios 31-34, se proporcionan una matriz de con- 
sumo C y un vector de demanda d. En cada caso, encuentre 
un vector de producción factible x que satisfaga la ecuación 


entradas en la columna de (I — Q) * marcada i. 


15. 


16. 


17. 


18. 


En el ejercicio 9, si el lunes es un día seco, ¿cuál es el nú- 
mero esperado de días hasta un día húmedo? 


En el ejercicio 10, ¿cuál es el número esperado de gene- 
raciones hasta que una persona baja tenga un descen- 
diente alto? 


En el ejercicio 11, si la cosecha de pino piñonero es ade- cas 
cuada un año, ¿cuál es el número esperado de años que 


deben pasar hasta que ocurre una buena cosecha? 

En el ejercicio 12, a partir de cada una de las otras unio- 
nes, ¿cuál es el número esperado de movimientos hasta 
que un robot llegue a la unión 4? 


(2). 

1/2 1/4 1 
e al 

1/2 1/2 3 

0.1 0.4 2 
mooli ta] 

0.3 0.2 1 

0.5 0.2 0.1 3 
33. C=|0 0.4 02 |d=|2 

0 0 0.5 4 

0.1 0.4 0.1 1.1 
34.C=|0 0.2 02 | d=|3.5 

0.3 0.2 03 2.0 


35. Sea A una matriz de n X n y A = O. Suponga que 
Ax < x para alguna x en R”, x = 0. Demuestre que 
x>0. 
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36. Sean A, B, Cy D matrices de n X n y x, y vectores en R”. 
demuestre las siguientes desigualdades: 
(a) SIA = B = OyC = D = O, entonces 
AC >= BD = 0. 
(b) SIA > Byx = 0,x + 0, entonces Ax > Bx. 


37. Una población con tres clases etáreas tiene una matriz 


1 1 3 
de Leslie L = | 0.7 0 0O |. Siel vector de población 
0 0.5 0 
100 
inicial es x, = | 100 |, calcule x}, X, y X,. 
100 
38. Una población con cuatro clases etáreas tiene una 
0 1 2 5 
matriz de Leslie L = a . Si el vector 
0 0.7 0 0 
0. 0 03 0 
10 
10 


de población inicial es x, = , calcule X,, X, y X3. 


10 


Cierta especie con dos clases etáreas de 1 año de dura- 
ción tiene una probabilidad de supervivencia de 80% de 
la clase 1 a la clase 2. Evidencia empírica demuestra que, 
en promedio, cada hembra pare cinco hembras por año. 
En consecuencia, dos posibles matrices de Leslie son 


al. al a el | 
! [o8 0 2 108 o 


10 
(a) A partir de x) = | al calcule x,,...,X, en cada 


39. 


caso. 

(b) Para cada caso, grafique el tamaño relativo de cada 
clase etárea contra el tiempo (como en la figura 
3.23). ¿Qué sugieren sus gráficas? 


40. Suponga que la matriz de Leslie para el escarabajo VW 
0 0 20 
esL=1|01 0 0 |. A partir de un x, arbitrario, 
0 0.5 0 


determine el comportamiento de esta población. 


41. Suponga que la matriz de Leslie para el escarabajo VW 
0 0 20 
esL=|s 0 0 |. Investigue el efecto de variar la 


0 05 0 


28 42. 


probabilidad de supervivencia s de los escarabajos 
jóvenes. 


Los caribúes se encuentran principalmente en las pro- 
vincias occidentales de Canadá y el noroeste estadouni- 
dense. La vida promedio de una hembra es de alrededor 
de 14 años. Las tasas de natalidad y supervivencia para 
cada grupo etáreo se proporcionan en la tabla 3.4, que 
muestra que las hembras de caribú no dan a luz durante 
sus primeros 2 años y paren aproximadamente una cría 
por año durante sus años intermedios. La tasa de mor- 
talidad para las crías jóvenes es muy alta. 


Tabla 3.4 

Edad Tasa de Tasa de 
(años) natalidad supervivencia 

0-2 0.0 0.3 

2—4 0.4 0.7 

4—6 1.8 0.9 

6-8 1.8 0.9 

8-10 1.8 0.9 
10-12 1.6 0.6 
12-14 0.6 0.0 


Los números de caribúes reportados en el Jasper 
National Park de Alberta en 1990 se muestran en la 
tabla 3.5. Con un CAS, prediga la población de cari- 
búes para 1992 y 1994. Luego proyecte la población 
para los años 2010 y 2020. ¿Qué concluye? (¿Qué su- 


Tabla 3.5 Población de caribués 
en el Jasper National 
Park, 1990 

Edad 

(años) Número 

0-2 10 

2-4 2 

4-6 8 

6-8 5 

8-10 12 

10-12 0 

12-14 1 


Fuente: World Wildlife Fund Canada 
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x< 


En los ejercicios 47-50, dibuje un grafo que tenga la matriz de 
adyacencia dada. 54. y, 


posiciones hace este modelo y cómo podría mejo- 0 0 1 10 0 0 0 1 1 
rarlo?) 000 11 00011 
49.11. 0 0 0 1 50.10 0 0 1 1 
Grafos y digrafos 1 1000 1 1 100 
En los ejercicios 43-46, determine la matriz de adyacencia del 01100 1 1 100 
grafo dado. 
En los ejercicios 51-54, determine la matriz de adyacencia del 
dida 02 digrafo dado. 
o i i 
i l DN 
44. 
Va v3 
52. V1 
V4 V3 
Va V2 
45. vı 
DIAN V3 
va Y 
53. vi 
46. V1 v2 
v4 


Va V5 
V3 
V5 v4 


47. 48. 


Rh =e a O 
ooo rr 
ooo BR 
O O O m= 
=. O . oO 
Rh = = =e 


=. on. oo 
O =e e m 
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En los ejercicios 55-58, dibuje un digrafo que tenga la matriz 
de adyacencia dada. 


0 1100 0 1 00 
0.000 1 
55. a 56. 
0 100 1 0 0 0 
1 0 1 1 0 0 1 0 
0 0 1 0 1 0100 1 
1 0 0 1 0 0 0 0 1 0 
57.10 0 0 0 1 58.|1 0 0 1 1 
1 0O 1 0 0 1 0 1 0 0 
0 1 0 1 0 1 1 0 0 0 


En los ejercicios 59-66, use potencias de matrices de adyacen- 
cia para determinar el número de trayectorias de la longitud 


especificada entre los vértices dados. 
59. Ejercicio 48, longitud 2, v, y Y, 
60. Ejercicio 50, longitud 2, v; y V, 
61. Ejercicio 48, longitud 3, v; y V3 
62. Ejercicio 50, longitud 4, V, y v» 
63. Ejercicio 55, longitud 2, v; a v3 
64. Ejercicio 55, longitud 3, v4 a Y; 
65. 
66. 


67. 


Ejercicio 58, longitud 3, v, a v} 
b 
Ejercicio 58, longitud 4, v, a V, (6) 
Sea A la matriz de adyacencia de un grafo G. 
(a) Si el renglón i de A es todo ceros, ¿qué implica esto 
acerca de G? 
(b) Si la columna j de A es toda ceros, ¿qué implica esto 
acerca de G? 


(c) 


Sea A la matriz de adyacencia de un digrafo D. 

(a) Si el renglón į de A? es todo ceros, ¿qué implica esto 
acerca de D? 

(b) Si la columna j de A? es toda ceros, ¿qué implica 
esto acerca de D? 


68. 


69. La figura 3.29 es el digrafo de un torneo con seis juga- 
dores, P, a P¿. Con matrices de adyacencia, clasifique a 
los jugadores primero al determinar sólo victorias, y 
luego al usar la noción de victorias combinadas y victo- 


rias indirectas, como en el ejemplo 3.69. 


(e) 
70. La figura 3.30 es un digrafo que representa una cadena 
alimenticia en un pequeño ecosistema. Una arista diri- 
gida de a a b indica que a tiene a b como fuente de ali- 
mento. Construya la matriz de adyacencia A para este 
digrafo y úsela para responder las siguientes preguntas. 
(a) ¿Cuál especie tiene las fuentes de alimento más di- 
rectas? ¿Cómo muestra A esto? 


P) P3 
Py i Pa 
P6 P5 
Figura 3.29 
Roedor 
Oso 
Planta 
Zorro Insect 
Pez Ave 
Figura 3.30 


¿Cuál especie es una fuente directa de alimento para 
la mayoría de las otras especies? ¿Cómo muestra A 
esto? 

Si a come a b y b come a c, se dice que a tiene a c 
como una fuente indirecta de alimento. ¿Cómo 
puede usar A para determinar cuál especie tiene 
más fuentes indirectas de alimento? ¿Cuál especie 
tiene más fuentes de alimento directas e indirectas 
combinadas? 


(d) Suponga que los contaminantes matan a las plantas 


en esta cadena alimenticia y quiere determinar el 
efecto que tendrá este cambio sobre el ecosistema. 
Construya una nueva matriz de adyacencia A* a 
partir de A, al borrar el renglón y la columna corres- 
pondientes a planta. Repita los incisos (a) a (c) y de- 
termine cuáles especies son las más y menos afecta- 
das por el cambio. 

¿Cuál será el efecto a largo plazo de la contamina- 
ción? ¿Qué cálculos matriciales demostrarán esto? 


71. Cinco personas se conectan todas mediante correo elec- 
trónico. Siempre que una de ellas escucha un trozo de 
chismorreo interesante, lo envía por correo electrónico 
a alguien más en el grupo, de acuerdo con la tabla 3.6. 
(a) Dibuje el digrafo que modela esta “red de chismo- 


rreo” y encuentre su matriz de adyacencia A. 


Tabla 3.6 
Remitente Destinatarios 
Ann Carla, Ehaz 
Bert Carla, Dana 
Carla Ehaz 
Dana Ann, Carla 
Ehaz Bert 


(b) Defina un paso como el tiempo que una persona 
tarda en enviar correo electrónico a todos los de su 
lista. (Por tanto, en un paso, el chisme va de Ann 
tanto a Carla como a Ehaz.) Si Bert escucha un 
rumor, ¿cuántos pasos transcurrirán para que todos 
los demás escuchen el rumor? ¿Qué cálculo matri- 
cial revela esto? 

(c) Si Ann escucha un rumor, ¿cuántos pasos transcu- 
rrirán para que los demás escuchen el rumor? ¿Qué 
cálculo matricial revela esto? 

(d) En general, si A es la matriz de adyacencia de un di- 
grafo, ¿cómo puede decir si el vértice i está conec- 
tado al vértice j mediante una trayectoria (de cierta 
longitud)? 

[La red de chismorreo en este ejercicio recuerda la 
noción de “seis grados de separación” (que se encuentra 
en la obra y la película del mismo nombre), que sugiere 
que cualesquiera dos personas están conectadas me- 
diante una trayectoria de conocidos cuya longitud es 
cuando mucho 6. El juego “Six Degrees of Kevin Bacon” 
asevera más frívolamente que todos los actores están co- 
nectados al actor Kevin Bacon en tal forma. ] 


72. Sea A la matriz de adyacencia de un grafo G. 
(a) Por inducción, pruebe que, para toda n = 1, la en- 
trada (1, j) de A” es igual al número de n-trayectorias 
entre los vértices 1 y j. 
(b) ¿Cómo deben modificarse el enunciado y la demos- 
tración del inciso (a) si G es un digrafo? 


73. Si A es la matriz de adyacencia de un digrafo G, ¿qué re- 
presenta la entrada (i, j) de AA? sii 4? 


Un grafo se llama bipartita si sus vértices pueden subdividirse 
en dos conjuntos U y V tales que toda arista tiene un punto 
final en U y el otro punto final en V. Por ejemplo, el grafo del 
ejercicio 46 es bipartita con U = {v}, v» v3} y V = {vp vs). En 
los ejercicios 74-77, determine si un grafo con la matriz de ad- 
yacencia dada es bipartita. 


74. La matriz de adyacencia en el ejercicio 47 
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75. La matriz de adyacencia en el ejercicio 50 


76. La matriz de adyacencia en el ejercicio 49 


0 0 1 O 1I 1 
0 0 1 O 1I 1 
77. 1 1 O 100 
00 T0 rl 
1 1 O 100 
1 1 0O 100 


78. (a) Demuestre que un grafo es bipartita si y sólo si sus 
vértices pueden etiquetarse de modo que su matriz 
de adyacencia pueda particionarse como 


(b) Con el resultado del inciso (a), demuestre que un 
grafo bipartita no tiene circuitos de longitud impar. 


79. Suponga que los cuatro vectores en Z4 se codifican al re- 
petir el vector dos veces. Por tanto, se tiene 


[0, 0] >[0, 0, 0, 0] 
[0,1] >[0,1,0, 1] 
[1,0] >[1,0, 1, 0] 
[1]>5[1,1,1 1] 


Demuestre que este código no es de corrección de error. 
80. Suponga que codifica los dígitos binarios 0 y 1 al repetir 
cada dígito cinco veces. Por tanto, 
o — [0, 0, 0, 0, 0] 
1—>[1,1,1,1,1] 


Demuestre que este código puede corregir errores dobles. 


¿Cuál es el resultado de codificar los mensajes en los ejercicios 
81-83 usando el código de Hamming (7, 4) del ejemplo 3.71? 


0 


8l. x= 82. x= 83. x = 


O oO.. 
h = 
pa pa paa 


Cuando se usa el código de Hamming (7, 4) del ejemplo 3.71, 
suponga que se reciben los mensajes c' en los ejercicios 84-86. 
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Aplique la matriz de control de paridad estándar a c' para 
determinar si ocurrió un error y decodificar correctamente c' 
para recuperar el vector mensaje original x. 


84.c=[0 1 0 0 1 0 1] 


85.c=[1 1 0 0 1 1 0 


8.c'=[0 0 1 1 1 1 of 


(b) Encuentre la matriz de control de paridad estándar 
asociada para este código. ¿Este código es de correc- 
ción de error (sencillo)? 


89. Defina un código Z3 > Z$ con la matriz generadora es- 


tándar 


87. El código de control de paridad en el ejemplo 1.37 es un 


código Z$ > Z. 


(a) Encuentre una matriz de control de paridad están- 


dar para este código. 


(b) Encuentre una matriz generadora estándar. 


(c) Aplique el Teorema 3.37 para explicar por qué este 
código no es de corrección de error. 


88. Defina un código Z} > Z3 con el uso de una matriz ge- 


neradora estándar 


Q 

Il 
=. oO e. OD me 
= =. O . O 


= = O O m 
=. =. O O. oO 
=. O0 Om. oOo 


1 


(a) Mencione las ocho palabras código. 

(b) Encuentre la matriz de control de paridad estándar 
asociada para este código. ¿Este código es de correc- 
ción de error (sencillo)? 


90. Demuestre que el código del ejemplo 3.70 es un código 
de Hamming (3, 1). 

91. Construya matrices de comprobación de paridad están- 
dar y generadora para un código de Hamming (15, 11). 

92. En el Teorema 3.37, demuestre que si B = A, entonces 
PGx = 0 para todo x en Z$. 

93. En el Teorema 3.37, demuestre que, si p; = p; entonces 
no es posible determinar si ocurre un error en el com- 


ponente i-ésimo o j-ésimo del vector recibido. 


base, 204 

Teorema de la base, 208 

matriz (vector) columna, 144 

espacio columna de una matriz, 201 

composición de transformaciones 
lineales, 225 

vector coordenada con respecto a una 
base, 214 

matriz diagonal, 145 

dimensión, 209 

matriz elemental, 176 

teorema fundamental de las matrices 
invertibles, 178,212 

matriz identidad, 145 

inverso de una matriz cuadrada, 
169 

inverso de una transformación lineal, 
227 


combinación lineal de matrices, 
160 
dependencia-independencia lineal de 
matrices, 163 
transformación lineal, 219 
factorización LU, 187 
matriz, 144 
suma matricial, 146 
factorización matricial, 186 
multiplicación matricial, 147 
potencias matriciales, 155 
negativo de una matriz, 146 
espacio nulo de una matriz, 203 
nulidad de una matriz, 210 
producto exterior, 153 
matrices particionadas (multiplicación 
por bloques), 151,154 
matriz permutación, 193 


propiedades del álgebra matricial, 
160, 164, 165, 173 

rank de una matriz, 210 

teorema del rank, 211 

representaciones de productos de 
matrices, 152-154 

matriz renglón (vector), 144 

espacio renglón de una matriz, 201 

múltiplo escalar de una matriz, 146 

generador de un conjunto de matrices, 
162 

matriz cuadrada, 145 

matriz estándar de una transformación 
lineal, 222 

subespacio, 198 

matriz simétrica, 157 

transpuesta de una matriz, 157 

matriz cero, 147 


1. Marque cada uno de los siguientes enunciados como 

verdadero o falso: 

(a) Para cualquier matriz A, tanto AA? como A7A están 
definidas. 

(b) Si A y B son matrices tales que AB = Oy A + O, en- 
tonces B = O. 

(c) Si A, B y X son matrices invertibles tales que XA = 
B, entonces X = A'B. 

(d) La inversa de una matriz elemental es una matriz 
elemental. 

(e) La transpuesta de una matriz elemental es una ma- 
triz elemental. 

(f£) El producto de dos matrices elementales es una ma- 
triz elemental. 

(g) Si A es una matriz de m X n, entonces el espacio 
nulo de A es un subespacio de R”. 

(h) Todo plano en R? es un subespacio bidimensional 
de RÌ. 

(i) La transformación T : R? —> R? definida por T(x) 
= —x es una transformación lineal. 

(j) Si T: R*>R? es una transformación lineal, enton- 
ces existe una matriz A de 4 X 5 tal que T(x) = Ax 
para toda x en el dominio de T. 


Sa 1 2 2 0 =] 
En los ejercicios 2-7, sea A = yB= ; 
3 -5 3 = 4 


Calcule la matrices indicadas si es posible. 
2. AB 3. ATB? 4. B"A™'B 
5. (BBI)! 6. (BTB)! 
7. El desarrollo del producto exterior de AA? 


1/2 Al 


8. Si A es una matriz tal que A™! = | 


—3/2 4 
encuentre A. 
1.0 =] 
9.SiA=|2 3 —1|yXesuna matriz tal que 
0 1 1 
=| =3 
AX = 5 0 |, encuentre X. 
go =2 


1 2 
10. Si es posible, exprese la matriz A = p como un 


producto de matrices elementales. 


11. 


12. 


13. 


14. 


15. 


16. 


17. 


18. 


19. 


20. 
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Si A es una matriz cuadrada tal que A? = O, demuestre 
que (1 A) *=I+A+A?. 


1 1 1 
Encuentre una factorización LU de A = | 3 1 1 
2 =] 1 


Encuentre bases para el espacio renglón, espacio 

2 —4 5 8 5 
columna y espacio nulo de A = |1 -2 2 3 

4-8 3 2 6 
Suponga que las matrices A y B son equivalentes en ren- 
glón. ¿Tienen el mismo espacio renglón? ¿Por qué sí o 
por qué no? ¿A y B tienen el mismo espacio columna? 
¿Por qué sí o por qué no? 


Eb 


Si A es una matriz invertible, explique por qué A y A” 
deben tener el mismo espacio nulo. ¿Esto es verdad si A 
es una matriz cuadrada no invertible? Explique. 


Si A es una matriz cuadrada cuyos renglones suman el 
vector cero, explique por qué A no puede ser invertible. 


Sea A una matriz de m X n con columnas linealmente 
independientes. Explique por qué ATA debe ser una ma- 
triz invertible. ¿AA? también debe ser invertible? Expli- 
que. 


Encuentre una transformación lineal T : R? —> R? tal 


rhil- 6I» elal- 

awaa E T = a 

Encuentre la matriz estándar de la transformación lineal 
T : R? —> R? que corresponda a una rotación de 45° en 
sentido contrario al de las manecillas del reloj en torno 
al origen seguida por una proyección sobre la recta 

y= =g 

Suponga que T : R” —> R” es una transformación lineal 
y suponga que v es un vector tal que T(v) #0, pero 

T? (v) = 0 (donde T? = T ° T). Demuestre que v y T(v) 
son linealmente independientes. 


En la literatura se ha usado casi 
toda combinación de los adjetivos 
propio, latente, característico, 
eigen y secular, con los sustantivos 
raíz, número y valor, para lo que 
llamamos un valor propio. 
—Paul R. Halmos 
Finite Dimensional Vector Spaces 
(2a. edición), Van Nostrand, 


1958, p. 102 
vi va 
Va v3 
Figura 4.1 
K, 
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4.0 Introducción: un sistema dinámico 
de grafos 


CAS 
En el último capítulo se vio que iterar la multiplicación de matrices con frecuencia pro- 
duce resultados interesantes. Tanto en las cadenas de Markov como en el modelo de Les- 
lie de crecimiento poblacional se muestran estados estacionarios en ciertas situaciones. 
Una de las metas de este capítulo es ayudarle a comprender tal comportamiento. Pri- 
mero se observará un proceso iterativo, o sistema dinámico, que usa matrices. (En los 
problemas siguientes encontrará útil usar un CAS o una calculadora con capacidades 
matriciales para facilitar los cálculos.) 

El ejemplo involucra grafos (vea la sección 3.7). Un grafo completo es aquel en el que 
todo vértice es adyacente a todo otro vértice. Si un grafo completo tiene n vértices, se de- 
nota K,. Por ejemplo, la figura 4.1 muestra una representación de K,. 


Problema 1 Escoja cualquier vector x en R4 con entradas no negativas y marque los 
vértices de K, con los componentes de x, de modo que y} se etiquete con x}, etcétera. Cal- 
cule la matriz de adyacencia A de K, y vuelva a etiquetar los vértices del grafo con los co- 
rrespondientes componentes de Ax. Intente esto para varios vectores x y explique, en térmi- 
nos del grafo, cómo pueden determinarse las nuevas etiquetas a partir de las etiquetas 
anteriores. 

Problema 2 Ahora itere el proceso en el problema 1. Esto es, para una elección dada de 
x, vuelva a etiquetar los vértices como se describió anteriormente y luego aplique de nue- 
vo A (y de nuevo, y de nuevo) hasta que surja un patrón. Dado que los componentes de 
los vectores se volverán bastante grandes, se les reducirá a escala al dividir cada vector 
entre su componente más grande después de cada iteración. Por tanto, si un cálculo re- 
sulta en el vector 


Rh = N A 


se le sustituirá con 


e= 


=. = N A 
= 
v 


Figura 4.2 


Figura 4.3 


Figura 4.4 


El adjetivo alemán eigen significa 
“propio” o “característico de”. 
Eigenvalores y eigenvectores son 
características de una matriz en el 
sentido de que contienen informa- 
ción importante acerca de la natu- 
raleza de la matriz. La letra A 
(lambda), la equivalente griega de 
la letra L, se usa para eigenvalores 
porque en una época también se 
conocían como valores latentes. El 
comentario es para los que hablan 
inglés. 
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Note que este proceso garantiza que el componente más grande de cada vector ahora 
será 1. Haga esto para K, luego K, y K;. Use al menos diez iteraciones y precisión a dos 
lugares decimales. ¿Qué parece ocurrir? 

Problema 3 Debe haber notado que, en cada caso, el vector que etiqueta tiende a 
cierto valor (¡una etiqueta de estado estacionario!). Etiquete los vértices de los grafos 
completos con este vector de estado estacionario y aplique la matriz de adyacencia A una 
vez más (sin escala). ¿Cuál es la relación entre las nuevas etiquetas y las anteriores? 

Problema 4 Haga una conjetura acerca del caso general K,. ¿Cuál es la etiqueta de es- 
tado estacionario? ¿Qué ocurre si se etiqueta K, con el vector de estado estacionario y se 
aplica la matriz de adyacencia A sin escala? 

Problema 5 En la figura 4.2 se muestra el grafo de Petersen. Repita el proceso de los 
problemas 1 al 3 con este grafo. 


Ahora se explorará el proceso con alguna otra clase de grafos para ver si se compor- 
tan en esta forma. El ciclo C, es el grafo con n vértices ordenados en forma cíclica. Por 
ejemplo, C; es el grafo que se muestra en la figura 4.3. 

Problema 6 Repita el proceso en los problemas 1 a 3, con ciclos C,, para varios valo- 
res impares de n y haga una conjetura acerca del caso general. 

Problema 7 Repita el problema 6 con valores pares de n. ¿Qué sucede? 


Un grafo bipartito es un grafo bipartito completo (vea los ejercicios 74-78 de la sec- 
ción 3.7) si sus vértices pueden partirse en conjuntos U y V tales que cada vértice en U 
es adyacente a cada vértice en V y viceversa. Si U y V tienen cada uno n vértices, enton- 
ces el grafo se denota K, „. Por ejemplo, K; ¿ es el grafo de la figura 4.4. 


Problema 8 Repita el proceso de los problemas 1 a 3 con grafos bipartitos completos 
K,„ n para varios valores de n. ¿Qué sucede? 


Hacia el final de este capítulo, estará en posición de explicar las observaciones reali- 
zadas en esta introducción. 


Introducción a eigenvalores y eigenvectores 


En el capítulo 3 se encontró la noción de vector de estado estacionario en el contexto de 
dos aplicaciones: cadenas de Markov y el modelo de Leslie de crecimiento poblacional. 
Para una cadena de Markov con matriz de transición P, un vector de estado estaciona- 
rio x tiene la propiedad de que Px = x; para una matriz de Leslie L, un vector de estado 
estacionario era un vector de población x que satisfacía Lx = rx, donde r representaba la 
tasa de crecimiento de estado estacionario. Por ejemplo, se vio que 


0 4 3 || 18 18 

0.7 0.2 || 0.4 0.4 
= y 05 0 0 6|=1.5| 6 

0.3 0.8]L0.6 0.6 
0 0.25 0 1 1 


En este capítulo se investiga este fenómeno de manera más general. Esto es, para una ma- 
triz cuadrada A, se pregunta si existen vectores distintos de cero x tales que Ax es justo 
un múltiplo escalar de x. Este es el problema del eigenvalor y es uno de los problemas cen- 
trales en álgebra lineal. Tiene aplicaciones en todas las matemáticas y también en mu- 
chos otros campos. 


Definición Sea A una matriz de n X n. Un escalar A se llama eigenvalor de A si 
existe un vector x distinto de cero tal que Ax = Ax. Tal vector x se llama eigenvector 
de A correspondiente a A. 
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Ejemplo 4.1 


> 


1 3 1 
Demuestre que x = H es un eigenvector de A = f a y encuentre el eigenvalor 
correspondiente. 
Solución Calcule 
3 1|1 4 1 
Ax = = =4 = 4x 
1 3/|1 4 1 
de donde se tiene que x es un eigenvector de A que corresponde al eigenvalor 4. 


at 


Ejemplo 4.2 


> 


, 1 2 ; . 
Demuestre que 5 es un eigenvalor de A = h 4 y determine todos los eigenvectores 
correspondientes a este eigenvalor. 


Solución Debe demostrar que existe un vector x distinto de cero tal que Ax = 5x. Pero 
esta ecuación es equivalente a la ecuación (A — 5I )x = 0, así que es necesario calcular el 
espacio nulo de la matriz A — 51. Se descubre que 


1 2 50 —4 2 
A-5I= = = 
4 3 0 5 4 -2 
Dado que las columnas de esta matriz es claro que son linealmente dependientes, el teo- 
rema fundamental de las matrices invertibles implica que su espacio nulo es distinto de 


cero. Por tanto, Ax = 5x tiene una solución no trivial, así que 5 es un eigenvalor de A. Sus 
eigenvectores se encuentran al calcular el espacio nulo: 


[A — 51/0] = e E — 


xX : ; z 
| es un eigenvector que corresponde al eigenvalor 5, satisface 


Por tanto, si x = 
Xz 


xı — 4% = 00x% = 3x, de modo que dichos eigenvectores son de la forma 


1 
12% 
x= 
X 


Esto es, son los múltiplos distintos de cero de | | (o, de manera equivalente, los múlti- 


“t 


El conjunto de todos los eigenvectores correspondientes a un eigenvalor A de una 
matriz A de n X n es justo el conjunto de vectores distintos de cero en el espacio nulo de 
A — Al. Por tanto, este conjunto de eigenvectores, junto con el vector cero en ”, es el es- 
pacio nulo de A — AL. 


1 
plos distintos de cero de p 


Sección 4.1 Introducción a eigenvalores y eigenvectores 261 


Definición Sea A una matriz de n X n y sea A un eigenvalor de A. La colección 
de todos los eigenvectores correspondientes a A, junto con el vector cero, se llama ei- 
genespacio de A y se denota E,. 


1 
Por tanto, en el ejemplo 4.2, E; = fd | » 


Ejemplo 4.3 
Demuestre que A = 6 es un eigenvalor de A = | —3 3 6 | y encuentre una base 
para su eigenespacio. 2.2 2 


Solución Como en el ejemplo 4.2, calcule el espacio nulo de A — 6I. La reducción por 
renglones produce 


1 I =2 I l =2 
A-—6I=|-3 -3 6| —>|0 0 0 
2 2 -4 0 0 0 


de donde se ve que el espacio nulo de A — 6I es distinto de cero. Por tanto, 6 es un ei- 
genvalor de A y los eigenvectores correspondientes a este eigenvalor satisfacen x, + x, — 


2x, =00x, = =x; + 2x,. Se tiene que 
—% + 2x, -1 2 = 
Es = X = 42| 1|+x|/0 = gen 11,0 
X3 0 1 oj L1 


En R? puede darse una interpretación geométrica de la noción de un eigenvector. La 
ecuación Ax = Ax dice que los vectores Ax y x son paralelos. Por tanto, x es un eigenvec- 
tor de A si y sólo si A transforma x en un vector paralelo [o, de manera equivalente, si y 
sólo si T,(x) es paralela a x, donde T, es la transformación matricial correspondiente a 


y i 


| > 


Ejemplo 4.4 E . : 1 0 
Encuentre geométricamente los eigenvectores y eigenvalores de A = al 


Solución Se reconoce que A es la matriz de una reflexión F en el eje x (vea el ejemplo 
3.56). Los únicos vectores que F mapea paralelos a ellos mismos son vectores paralelos al 


eje y (es decir: múltiplos de Hi que están invertidos (eigenvalor —1), y vectores 
paralelos al eje x (es decir, múltiplos de h que se envían a ellos mismos (eigenvalor 1) 


(vea la figura 4.5). En concordancia, à = —1 y A = 1 son los eigenvalores de A, y los co- 
rrespondientes eigenespacios son 


ee) y a-wo([) 
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La discusión se basa en el artículo 
“Eigenpictures: Picturing the 
Eigenvector Problem” de Steven 
Schonefeld en The College Mathe- 
matics Journal 26 (1996), pp. 316- 
319; 


Figura 4.5 


Los eigenvectores de una reflexión | 
y 


Figura 4.6 


Otra forma de pensar geométricamente en los eigenvectores es dibujar x y Ax de ori- 
gen a punta. Entonces x será un eigenvector de A si y sólo si x y Ax están alineados en una 
recta. En la figura 4.6, x es un eigenvector de A pero y no lo es. 

Si x es un eigenvector de A correspondiente al eigenvalor A, entonces también lo es 
cualquier múltiplo de x distinto de cero. De este modo, si quiere encontrar eigenvectores 
geométricamente, sólo es necesario considerar el efecto de A sobre vectores unitarios. La 
figura 4.7(a) muestra lo que ocurre cuando se transforman vectores unitarios con la ma- 


at 
triz A = | j i del ejemplo 4.1 y muestra los resultados origen a punta, como en la fi- 


1/V2 
gura 4.6. Puede ver que el vector x = | y = es un eigenvector, pero note también que 


parece haber un eigenvector en el segundo cuadrante. De hecho, este es el caso, y evi- 


ica i Ee 
encia ser el vector 1 J VI ; 
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>x 


Av 


4 


(a) b 


( 


= 


Figura 4.7 


1 1 


En la figura 4.7(b) se ve lo que ocurre cuando se usa la matriz A = | mn A ¡No 


hay eigenvectores! 

Ahora sabe cómo encontrar eigenvectores una vez que tiene los eigenvalores corres- 
pondientes, y tiene una interpretación geométrica de ellos, pero surge una pregunta: 
¿cómo se encuentran por primera vez los eigenvalores de una matriz dada? La clave es la 
observación de que A es un eigenvalor de A si y sólo si el espacio nulo de A — Al es no 


trivial 
; a b 
Recuerde de la sección 3.3 que el determinante de una matriz de 2 X 2 A = | | 
c 


es la expresión A = ad — bc, y A es invertible si y sólo si det A es distinta de cero. Más 
aún, el teorema fundamental de las matrices invertibles garantiza que una matriz tiene 
un espacio nulo no trivial si y sólo si no es invertible; es decir, si y sólo si su determinante 
es cero. Al juntar estos hechos, se ve que (al menos para matrices de 2 X 2) À es un ei- 
genvalor de A si y sólo si det(A — AI) = 0. Este hecho caracteriza a los eigenvalores, y 
pronto se le generalizará a matrices cuadradas de tamaño arbitrario. Sin embargo, por el 
momento, vea cómo usarlo con matrices de 2 X 2. 


Ejemplo 4.5 


>» 
Encuentre todos los eigenvalores y los correspondientes eigenvectores de la matriz A = 


Na lo 4.1 
y 3 | del ejemplo 4.1. 


Solución Las observaciones anteriores muestran que debe encontrar todas las solucio- 
nes À de la ecuación det(A — AI) = 0. Puesto que 


3=À 1 
1 3=A 
es necesario resolver la ecuación cuadrática A? — 64 + 8 = 0. Se encuentra fácilmente 


que las soluciones a esta ecuación son A = 4 y A = 2. Por tanto, esos son los eigenvalores 
de A. 


det(A — A1) = da |-6 A3- A) -1=X 648 
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Para encontrar los eigenvectores correspondientes al eigenvalor A = 4, calcule el es- 
pacio nulo de A — 4I. Se encuentra que 
Al | 1 =l o] 
=> 
0 o  0j0 


| es un eigenvector que corresponde a À = 4 si y sólo 


=j 1 


(a arto] =] si 


. X 
de donde se tiene que x = | Ñ 
X 


x 1 
six, —=x,=00x, = x. Por tanto, el eigenespacio E, = (| >) = el l = 


a([) | 


De igual modo, para A = 2, se tiene 


1 1 


ta —2110]= | l 


0 PE 
=> 
0 o olo 


A es un eigenvector que corresponde a À = 2 si y sólo si y, + y, = 00 


de modo que y = p 


2 


— -1 -1 
yı = —J2. Por tanto, el eigenespacio E, = il 2) = ba l F sen( | i) 
Ya 


La figura 4.8 muestra gráficamente cómo se transformaron los eigenvectores de A 
cuando se multiplicaron por A: un eigenvector x en el eigenespacio E, se transforma en 
4x, y un eigenvector y en el eigenespacio E, se transforma en 2y. Como muestra la figura 
4.7(a), los eigenvectores de A son los únicos vectores en R? que se transforman en múlti- 
plos escalares de ellos mismos cuando se multiplican por A. 


47 Ax = 4x 


H H H | x 
4 3 2 3 4 
-2+ 
-3+4 
4 
Figura 4.8 


Cómo A transforma eigenvectores 
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Comentario  Recordará que una ecuación polinomial con coeficientes reales (como la 
ecuación cuadrática del ejemplo 4.5) no necesita tener raíces reales; puede tener raíces 
complejas. (Vea el Apéndice C.) También es posible calcular eigenvalores y eigenvectores 
cuando las entradas de una matriz provienen de Z, donde p es primo. Por tanto, es im- 
portante especificar el escenario en el que se intenta trabajar antes de calcular los eigenva- 
lores de una matriz. Sin embargo, a menos que se especifique de otro modo, los eigenvalo- 
res de una matriz cuyas entradas sean números reales se supondrá que también son reales. 


| > 
Ejemplo 4. Interprete la matriz del ejemplo 4.5 como una matriz sobre Z, y encuentre sus eigenva- 
P jemp 3 Y 8 
lores en dicho campo. 


Solución La solución procede exactamente como antes, excepto que se trabaja en mó- 
dulo 3. Por tanto, la ecuación cuadrática A? — 64 + 8 = 0 se convierte en A? + 2 = 0. 
m—> Esta ecuación es la misma que A? = —2 = 1, lo que produce A = 1 y à = —1 = 2 como 
los eigenvalores en Z,. (Compruebe que obtendría la misma respuesta al primero redu- 


-A 


| > 


; 0 1 a 
cir A a módulo 3 para obtener | i a y luego trabajar con esta matriz.) 


Ejemplo 4.7 


0 = 
Encuentre los eigenvalores de A = | i 2] (a) sobre R y (b) sobre los números com- 
plejos C. 


Solución Debe resolver la ecuación 


=À 
= A=Al) = 
0 = det( ) der q 


(a) Sobre R no hay soluciones, de modo que A no tiene eigenvalores reales. 
(b) Sobre C las soluciones son A = iy A = —i. (Vea el Apéndice C.) | 


1 
[SS 


En la siguiente sección se extenderá la noción de determinante de 2 X 2 a matrices 
de n X n, que a su vez permitirán encontrar los eigenvalores de matrices cuadradas ar- 
bitrarias. (De hecho, esto no es totalmente cierto, pero al menos podrá encontrar una 
ecuación polinomial que deben satisfacer los eigenvalores de una matriz dada.) 


|Hercieios 4.1 


En los ejercicios 1-6, demuestre que v es un eigenvector de A y 4 —2 2 

encuentre el eigenvalor correspondiente. 4A= 5 7-10 
was" ¿he 30 0 > 
L3 0 1 5.A=|0 1 -2|v=|-1 

[2 3 2 

2.A = E = | | 1 0 1 1 
3 2 22 1 3 -1 -2 

[-1 1 1 Z z 
TE E £ | | 6A=|1 2  0|v 1 
L6 0 2 1 1 1 1 
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En los ejercicios 7-12, demuestre que A es un eigenvalor de A y En los ejercicios 19-22, los vectores unitarios x en R? y sus 
encuentre un eigenvector correspondiente a este eigenvalor. imágenes Ax bajo la acción de una matriz A de 2 X 2 se dibu- 
1) 2 jan origen a punta, como en la figura 4.7. Estime los eigenvec- 
HAS 2-1 | A=3 tores y eigenvalores de A a partir de cada “eigendibujo”. 
[2 2 
8.A = | à= -2 19. y 
[2 =i 4 
id 4 
9.A = | A=1 
=] 3 
Po 4 ij 
10.A = JA=4 
[=1 5 
1-0 .2 
1.A=|-1 1 1|A4=-—1 
2 0 1 l 
t X 
E =i -2 2 
12.A=|0 1 21,4=3 
4 2 0 
En los ejercicios 13-18, encuentre geométricamente los eigen- [0 
valores y eigenvectores de A. 
[-1 0 ' N 
13. A = T (reflexión en el eje y) + 
fo 1 i 
14. A = Lö (reflexión en la recta y = x) 20. $ 
[1 0 -> E 6 
15.4 = .. (proyección sobre el eje x) 
ple 12 | 
16. A = a al (proyección sobre la recta que pasa por el | 
L25 25 4 l 
origen con vector director b Ji 
5 
17.A = f o (estiramiento por un factor de 2 horizon- E IS] 2 
talmente y un factor de 3 verticalmente) 1 


0  —1 
l 3] (rotación de 90° en sentido contrario al 


de las manecillas del reloj en torno al origen) 


18.4 = | 


21. y 


=2 


A 


22. 


y 
A 


ZK 


í 


En los ejercicios 23-26, use el método del ejemplo 4.5 para en- 
contrar todos los eigenvalores de la matriz A. Obtenga bases 
para cada uno de los eigenespacios correspondientes. Ilustre los 
eigenespacios y el efecto de multiplicar los eigenvectores por A, 
como en la figura 4.8. 


4 —1 0 2 
23. A = 24.A = 

2 1 8 6 

2 5 2 1 
25. A = 26. A = 

0 2 1 2 


En los ejercicios 27-30, encuentre todos los eigenvalores de la 
matriz A en los números complejos C. Obtenga bases para 
cada uno de los eigenespacios correspondientes. 


L 1 L =2 
27.4=| | 28. A = | | 
=i 1 1 1 


38. 
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Introducción a eigenvalores y eigenvectores 


En los ejercicios 31-34, encuentre todos los eigenvalores de la 
matriz A en el Z, indicado. 


1 0 2 1 
| ES 2A=| Jaz, 

17.2 1 2 

3 1 11.4 
35.4=| Jaz, | Jaz, 

4 0 4 0 


35. (a) Demuestre que los eigenvalores de la matriz 2 X 2 
a b 
A= 
| cd ] 
son soluciones de la ecuación cuadrática A? — 
tr(AJA + det A = 0, donde tr(A) es la traza de A. 
(Vea la página 168.) 


(b) Demuestre que los eigenvalores de la matriz A en el 
inciso (a) son 


A=1la + d+vV(a — d)? + 4bc) 


(c) Demuestre que la traza y el determinante de la ma- 
triz A en el inciso (a) están dados por 


tr(A) =A +A y detA = AÀA, 


donde A, y A, son los eigenvalores de A. 


36. Considere nuevamente la matriz A en el ejercicio 35. 
Proporcione las condiciones para a, b, c y d tales que A 
tenga 

(a) dos eigenvalores reales distintos, 

(b) un eigenvalor real y 


(c) ningún eigenvalor real. 


37. Demuestre que los eigenvalores de la matriz triangular 
superior 
a b 
0 d 
son A = a y À = d, y encuentre los correspondientes ei- 
genespacios. 


Sean a y b números reales. Encuentre los eigenvalores y 
eigenespacios correspondientes de 


Bs 


en los números complejos. 


A= 
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Históricamente, los determinantes precedían a las matrices, un hecho curioso a la luz de 
la forma como se enseña el álgebra lineal en la actualidad, con las matrices antes que los 
determinantes. No obstante, los determinantes surgen independientemente de las ma- 
trices en la solución de muchos problemas prácticos, y la teoría de los determinantes es- 
taba bien desarrollada casi dos siglos antes de que a la matrices se les otorgara un valor 
de estudio como tal. Al final de esta sección se presenta una reseña histórica de los deter- 
minantes. 

41 an 


| de 2 X 2 es 
41 An 


Recuerde que el determinante de la matriz A = | 


det A = aan — 4174), 


Esta expresión se encontró por primera vez cuando se determinaron formas para calcu- 
lar la inversa de una matriz. En particular, se encontró que 


- ki E 
41 ña] — 1 | 42 ña] 
La An 4114) — AM | =a 411 


El determinante de una matriz A en ocasiones también se denota por |A|, de modo que 


. 41 An ; ae 
para la matriz A = de 2 X 2 es posible escribir 
LA An 
41 An 
A] = = 41142 — 41243] 
A Az 


Advertencia Esta notación para el determinante recuerda la notación del valor 


41 An 
41 An 


absoluto. Es fácil confundir la notación , para determinante, con la notación 


A An z z j 
| , para la matriz en sí. No las confunda. Por fortuna, usualmente será claro por 
my An 


el contexto lo que se pretende. 


Se define el determinante de una matriz A = [a] de 1 X 1 como 
det A = la] =a 


(Note que realmente debe tener cuidado con esta notación: en este caso, |a | no denota el 
valor absoluto de a.) ¿Cómo se define entonces el determinante de una matriz de 3 X 3? 
Si a su CAS le solicita la inversa de 


abe 
A=ld e f 
g hi 
la respuesta será equivalente a 
ei—=fh ch= bi bf =c 
A` =—]| fg-di ai—cg cd-— af 
dh — eg bg—ah ae- bd 
donde A = aei — afh — bdi + bfg + cdh — ceg. Observe que 
A = aei — afh — bdi + bfg + cdh — ceg 
= alei — fh) — b(di — fg) + c(dh — eg) 
e fl a f d e 


a SG 


i gi g h 


Sección 4.2 Determinantes 215 


y que cada una de las entradas en la porción de matriz de A”? parezca ser el determinante 
de una submatriz de 2 X 2 de A. De hecho, esto es cierto, y es la base de la definición del 
determinante de una matriz de 3 X 3. La definición es recursiva en el sentido de que el de- 
terminante de una matriz de 3 X 3 se define en términos de determinantes de matrices de 
2X2. 


Definición SeaA = |a; a, as; |. Entonces el determinante de A es el escalar 


a aA 
det A = |A| = a 2 P a) 


32 Az 


Note que cada uno de los determinantes de 2 X 2 se obtiene al borrar el renglón y la 
columna de A que contienen la entrada por la que se multiplica el determinante. Por 
ejemplo, el primer sumando es a,, multiplicado por el determinante de la submatriz ob- 
tenida al borrar el renglón 1 y la columna 1. Note también que los signos más y menos 
se alternan en la ecuación (1). Si se denota con A; la submatriz de una matriz A obtenida 
al borrar el renglón i y la columna j, entonces la ecuación (1) se puede abreviar como 


det A = aj, det Aa) det Aj, + a, det Aj, 


3 
= X (-1)'Wa, det Ay 


j=1 


Para cualquier matriz cuadrada A, det A, se llama menor-(i, į) de A. 


Ejemplo 4.8 


Calcule el determinante de 


5 =3 2 
A= 0 2 
2 Sl 
Solución Calcule 
0 2 1 2 1 (0) 
det A = =(=3) +2 
=L 3 2 3 2 =f 


(0 =(=2)) + 3(3 — 4) +2(=1 — 0) 
=5(2) +3(=1) + A=1) =5 


Con un poco de práctica, debe descubrir que puede trabajar fácilmente determinantes 
de 2 X 2 en su cabeza. Entonces, escribir la segunda línea en la solución anterior es in- 


necesario. 


Otro método para calcular el determinante de una matriz de 3 X 3 es análogo al mé- 
todo para calcular el determinante de una matriz de 2 X 2. Copie las primeras dos co- 
lumnas de A a la derecha de la matriz y tome los productos de los elementos en las seis 
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diagonales que se muestran a continuación. Agregue signos más a los productos de 
las diagonales con pendiente descendente y signos menos a los productos de las diago- 
nales con pendiente ascendente. 


(2) 


Este método produce 
4114),433 + A233; + 41343143, — A3,07,413 — A3234] — 03303101) 


En el ejercicio 19 se le pedirá comprobar que este resultado está de acuerdo con el de la 
ecuación (1) para un determinante de 3 X 3. 


Ejemplo 4.9 


> 
Calcule el determinante de la matriz en el ejemplo 4.8 con el método que se muestra 


en (2). 


Solución Agregue a A sus primeras dos columnas y calcule los seis productos indica- 
dos: 


Sumar los tres productos en la parte baja y restar los tres productos en la parte superior 
produce 


det A = 0 + (-12) + (2) — 0 — (-10) — (-9) =5 


como antes. A 


Advertencia Está a punto de definir determinantes para matrices cuadradas arbi- 
trarias. Sin embargo, no hay un análogo del método en el ejemplo 4.9 para matrices más 
grandes. Sólo es válido para matrices de 3 X 3. 


Determinantes de matrices de n x n 


La definición del determinante de una matriz de 3 X 3 se extiende naturalmente a ma- 
trices cuadradas arbitrarias. 


Definición sea a = [a;] una matriz de n X n, donde n = 2. Entonces el deter- 
minante de A es el escalar 


det A = |A| = a det A, — ap det Ay, +*+ + (—1)**a,, det A,, 


NG ads (3) 


Jl 
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Es conveniente combinar un menor con su signo más o menos. Para este fin, se define el 
cofactor-(i, į) de A como 


Es = (=1)" det A 


Con esta notación, la definición (3) se convierte en 


det A = 3 aC; (4) 


El ejercicio 20 le pide comprobar que esta definición proporciona correctamente la fórmula 
para el determinante de una matriz de 2 X 2 cuando n = 2. 

Con frecuencia, a la definición (4) se le conoce como expansión por cofactores a lo 
largo del primer renglón. ¡Es un hecho sorprendente que se obtenga exactamente el 
mismo resultado al expandir a lo largo de cualquier renglón (o incluso cualquier co- 
lumna)! Este hecho se resume como teorema, pero la demostración se difiere hasta el 
final de esta sección (pues es un poco larga e interrumpiría el análisis si se presentara 
aquí). 


Teorema 4.1 


Teorema de expansión de Laplace 
El determinante de una matriz A de n X n, donde n = 2, puede calcularse como 
det A= aCi F Aj Cia ar de =p (AC 


z 5 
E 


(que es la expansión por cofactores a lo largo del i-ésimo renglón) y también como 


det A = aC + aC) r O 


n 6 


(la expansión por cofactores a lo largo de la j-ésima columna). 


Dado que C; = (—1) det Aip cada cofactor es más o menos el correspondiente menor, 
donde (—1)'* proporciona el signo correcto. Una forma rápida de determinar si el signo 
es + o — es recordar que los signos forman un patrón de “tablero de ajedrez”: 


+= + - 
- + - + 
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Ejemplo 4.10 


Pierre Simon Laplace (1749-1827) 
nació en Normandía, Francia, y se 
esperaba que se convirtiera en 
clérigo hasta que se descubrió su 
talento matemático en la escuela. 
Hizo muchas importantes 
aportaciones al cálculo, la 
probabilidad y la astronomía. Fue 
examinador del joven Napoleón 
Bonaparte en el Real Cuerpo de 
Artilleros y, más tarde, cuando 
Napoleón estuvo en el poder, sirvió 
brevemente como ministro del 
Interior y luego como canciller del 
Senado. Laplace fue honrado con el 
título de conde del Imperio en 1806 
y en 1817 recibió el título de 
marqués de Laplace. 


Calcule el determinante de la matriz 


5 =3 2 
A=|1 0 2 
2. =] 


por (a) expansión por cofactores a lo largo del tercer renglón y (b) expansión por cofac- 
tores a lo largo de la segunda columna. 


Solución 
(a) Calcule 


det A = æC; + a3,C3, + a33C33 


=3 2 5 2 5 =3 
= = (-1) 3 
0 2 1 2 1 0 
= 2(-6) + 8 + 3(3) 
=5 
(b) En este caso se tiene 
det A = aCi + aC + 43,3, 
1 2 5 2 5- 2 
= (3 0 - (-1 
( ) 2 3 2 , ( ) 1 2 
=3-1)+0+8 


=.5 


-t 


Note que en el inciso (b) del ejemplo 4.10 fue necesario hacer menos cálculos que en 
el inciso (a) porque se expandió a lo largo de una columna que contenía una entrada 
cero: a saber, a,,; por tanto, no fue necesario calcular C,,. Se tiene que el teorema de ex- 
pansión de Laplace es más útil cuando la matriz contiene un renglón o una columna con 
muchos ceros, pues al elegir expandir a lo largo de dicho renglón o columna, se mini- 
miza el número de cofactores que es necesario calcular. 


Ejemplo 4.11 


Calcule el determinante de 


-3 0 1 
5 4 2 0 
A= 
1 =L 0 3 
=2 1 0 0 


Solución Primero, note que la columna 3 sólo tiene una entrada distinta de cero; por 
tanto, debe expandir a lo largo de esta columna. A continuación, note que el patrón +/— 
asigna un signo menos a la entrada a,, = 2. Por tanto, se tiene 


Ejemplo 4.12 
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det A = aCi; + a,,C)3 + a33C33 + a43Cas 
= 0(C¡3) + 2C,, + 0(C33) + 0(C4s) 


2 l 
==2 1 =i 3 
=2 1 0 


Ahora continúe expandiendo a lo largo del tercer renglón del determinante anterior (la 
tercera columna también sería una buena elección) para obtener 


det A = 2 = f = s 2) 
= —2(—2(—8) — 5) 
= -2(11) = -22 


(Note que el patrón +/— para el menor de 3 X 3 no es el de la matriz original, sino el de 


una matriz de 3 X 3 en general). 


La expansión de Laplace es particularmente útil cuando la matriz es triangular (su- 
perior o inferior). 


Calcule el determinante de 


2 =9 Dl 0 4 
0 de o a 7 
A=]|0 0 1 6 0 
0 0 0 5 2 
0 0 0 0 =] 


3 2 -5 7 

0 1 6 
det A = 2 

0 0 5 2 

0.0.0 =] 


(Se omitieron todos los cofactores correspondientes a las entradas cero.) Ahora expanda 
nuevamente a lo largo de la primera columna: 


1 6 0 
det A =2-+310 5 2 
0.0 =] 


Al seguir expandiendo a lo largo de la primera columna, se completa el cálculo: 


5 
detA = 2n asl 


123 — 2-0) =2:3+1-5-(-1) = —30 


e 
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El ejemplo 4.12 debe convencerlo de que el determinante de una matriz triangular es el 
producto de sus entradas diagonales. En el ejercicio 21 se le pedirá ofrecer una prueba de 
este hecho. El resultado se registra como teorema. 


Teorema 4.2 


El determinante de una matriz triangular es el producto de las entradas en su diagonal 
principal. Específicamente, si A = [a] es una matriz triangular de n X n, entonces 


det A = 41142, "*" Ann 


Nota En general (esto es, a menos que la matriz sea triangular o tenga alguna otra 
forma especial), calcular un determinante mediante expansión por cofactores no es efi- 
ciente. Por ejemplo, el determinante de una matriz de 3 X 3 tiene 6 = 3! sumandos, y 
cada uno requiere dos multiplicaciones, y luego se necesitan cinco sumas y restas para ter- 
minar los cálculos. Para una matriz de n X n, habrá n! sumandos, cada uno con n— 1 mul- 
tiplicaciones, y luego n! — 1 sumas y restas. El número total de operaciones es por tanto 


T(n) =(n- Dn +n -1>m! 


Incluso la más rápida de las supercomputadoras no puede calcular el determinante 
de una matriz moderadamente grande con el uso de la expansión por cofactores. Para 
ilustrar: suponga que necesita calcular un determinante de 50 X 50. (Matrices mucho 
más grandes que 50 X 50 se usan para almacenar los datos de las imágenes digitales 
como las que se transmiten por Internet o las que se toman con una cámara digital.) 
Calcular el determinante directamente requeriría, en general, más de 50! operaciones, y 
50! = 3 X 10%, Si tuviera una computadora que pudiera realizar un billón (10'?) opera- 
ciones por segundo, tardaría aproximadamente 3 X 10° segundos, o casi 10% años, en 
terminar los cálculos. Para poner esto en perspectiva, considere que los astrónomos esti- 
man la edad del universo en al menos 10 mil millones (10%) de años. Por ende, incluso 
en una supercomputadora muy rápida, ¡calcular un determinante 50 X 50 mediante ex- 
pansión por cofactores tardaría más de 10% veces la edad del universo! 

Por fortuna, existen métodos mejores, y ahora se desarrollarán medios computacio- 
nalmente más efectivos para encontrar determinantes. Primero, es necesario observar al- 
gunas de las propiedades de los determinantes. 


Propiedades de los determinantes 


La forma más eficiente de calcular determinantes es usar reducción por renglones. Sin 
embargo, no toda operación elemental con renglones deja sin cambios el determinante 
de una matriz. El siguiente teorema resume las principales propiedades que necesita en- 
tender con la finalidad de usar de manera efectiva la reducción por renglones. 


Teorema 4.3 


Sea A = [aj] una matriz cuadrada. 


a. Si A tiene un renglón (columna) cero, entonces det A = 0. 

b. Si B se obtiene al intercambiar dos renglones (columnas) de A, entonces 
det B = —detA. 

c. Si A tiene dos renglones (columnas) idénticos, entonces det A = 0. 

d. Si B se obtiene al multiplicar un renglón (columna) de A por k, entonces det B = 
k det A. 

e. Si A, By C son idénticas, excepto que el i-ésimo renglón (columna) de C es la 
suma de los ¡-ésimos renglones (columnas) de A y B, entonces det C = det A + 
det B. 

f. Si B se obtiene al sumar un múltiplo de un renglón (columna) de A a otro 
renglón (columna), entonces det B = det A. 
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Demostración Se demostrará (b) como Lema 4.14 al final de esta sección. Las demos- 
traciones de las propiedades (a) y (f) se dejan como ejercicios. Las propiedades restantes 
se probarán en términos de renglones; las demostraciones correspondientes a columnas 
son análogas. 


(c) Si A tiene dos renglones idénticos, intercámbielos para obtener la matriz B. Clara- 
mente, B = A, de modo que det B = det A. Por otra parte, por (b), det B = —det A. Por 
tanto, det A = —det A, de modo que det A = 0. 

(d) Suponga que el renglón i de A se multiplica por k para producir B; esto es, b; = ka; 
paraj = 1,...,n. Dado que los cofactores C; de los elementos en los ¡-ésimos renglones 
de A y B son idénticos (¿por qué?), expandir a lo largo del 1-ésimo renglón de B produce 


j=1 j=1 j=1 


(e) Como en (d), los cofactores C; de los elementos en los ¡-ésimos renglones de A, B y 
C son idénticos. Más aún, c; = a; + b; paraj = 1,...,n. Expanda a lo largo del i-ésimo 
renglón de C para obtener 


j=l j=1 j=1 j=1 


—— 


Note que las propiedades (b), (d) y (f) se relacionan con operaciones elementales con 
renglones. Dado que la forma escalonada de una matriz cuadrada es necesariamente 
triangular superior, puede combinar estas propiedades con el Teorema 2 para calcular de- 
terminantes de manera eficiente. (Vea la Exploración: “Conteo de operaciones” en el ca- 
pítulo 2, que muestra que la reducción por renglones de una matriz de n X n usa en el 
orden de 1? operaciones, mucho menos que las n! necesarias para la expansión por co- 
factores.) Los siguientes ejemplos ilustran el cálculo de determinantes usando reducción 
por renglones. 


Ejemplo 4.13 


> 
Calcule det A si 
2 3 =] 

(a) A= 0 5 3 

—4 —6 

0 2 —4 5 

3 0 -3 6 
(b) A= 

2 4 5 7 

5 =l =3 1 
Solución 


(a) Con la propiedad (f) y luego la propiedad (a), se tiene 
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(b) Se reduce A a forma escalonada del modo siguiente (existen otras formas posibles de 
hacer esto): 


0 2 -4 5 3 0 -3 6 I 0 =i 2 
3 0-3 6ļRker lo 2 -4 5ks ló 2 -45 
det A = = — =- 
2.4 57 2 4 57 2.4 57 
ssl =- 1 us 8 5 1-31 
RR |1 0 -1 2 1 0 = 2 
Rost Jo 2 -4  5|kor 0 -1 2 -9 
E A 
Del 2 -9 0 2 -4 5 


R+4R |1 0 =1 2 
R,+2R; |0 —1 2 —9 
0 0 15 —33 
0 0 0 =15 


=3-1-(-1)+15-(-13) = 585 


Comentario Por el Teorema 4.3, también puede usar operaciones elementales con co- 
lumnas en el proceso de calcular determinantes, y puede “mezclar y combinar” operaciones 
elementales en renglones y columnas. Por ejemplo, en el ejemplo 4.13(a), podría comenzar 
con la suma de la columna 3 a la columna 1 para crear un 1 como pivote en la esquina su- 
perior izquierda. De hecho, el método que se utilizó fue más rápido, pero en otros ejemplos 
las operaciones en columnas pueden acelerar los cálculos. Tenga esto en mente cuando tra- 
baje determinantes a mano. 


Recuerde de la sección 3.3 que una matriz elemental resulta de realizar una operación 
elemental con renglón sobre una matriz identidad. Al hacer A = 1, en el Teorema 4.3 se 
produce el siguiente teorema. 


Teorema 4.4 


La palabra lema se deriva del verbo 
griego lambanein, que significa 
“asir”. En matemáticas, un lema es 
c sye » 
un “teorema auxiliar” que se 
“agarra” y se usa para probar otro 
teorema, por lo general más im- 
portante. 


Sea E una matriz elemental de n X n. 


a. Si E resulta de intercambiar dos renglones de I„ entonces det E = —1. 
b. Si E resulta de multiplicar un renglón de I, por k, entonces det E = k. 
c. Si E resulta de sumar un múltiplo de un renglón de I, a otro renglón, entonces 


det E = 1. 


Demostración Dado que det I, = 1, al aplicar (b), (d) y (f) del Teorema 4.3 inmediata- 
mente produce (a), (b) y (c), respectivamente, del Teorema 4.4. | 


A continuación, recuerde que al multiplicar por la izquierda una matriz B por una 
matriz elemental realiza la correspondiente operación elemental con renglón sobre B. 
Por tanto, es posible parafrasear sucintamente (b), (d) y (f) del Teorema 4.3 como el 
lema siguiente, cuya prueba es directa y se deja como el ejercicio 43. 
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Lema 4.5 


Sea B una matriz de n X n y sea E una matriz elemental de n X n. Entonces 


det(EB) = (det E)(det B) 


Puede usar el Lema 4.5 para demostrar el teorema principal de esta sección: una ca- 
racterización de la inversibilidad en términos de determinantes. 


Teorema 4.6 


Una matriz cuadrada A es invertible si y sólo si det A # 0. 


Demostración Sea A una matriz de n X ny sea R la forma escalonada reducida por ren- 
glones de A. Primero se demostrará que det A + 0 si y sólo si det R + 0. Sean E,, E,,..., 
E, las matrices elementales correspondientes a las operaciones elementales con renglo- 
nes que reducen A a R. Entonces 


E, E,E,A = R 
Al sacar determinantes de ambos lados y aplicar repetidamente el Lema 4.5, se obtiene 


(det E,) ++- (det E,)(detE,)(detA) = det R 


Por el Teorema 4.4, los determinantes de todas las matrices elementales son distintos de 
cero. Se concluye que A + 0 si y sólo si det R + 0. 

Ahora suponga que A es invertible. Entonces, por el teorema fundamental de las ma- 
trices invertibles, R = I„ de modo que det R = 1 + 0. En consecuencia, también 
det A % 0. Por el contrario, si A + 0, entonces det R + 0, de modo que R no puede con- 
tener un renglón cero, por el Teorema 4.3(a). Se tiene que R debe ser 1, (¿por qué?), de 
modo que A es invertible, nuevamente por el teorema fundamental. — A 


Ahora se tratará de determinar qué relación, si la hay, existe entre los determinantes y 
algunas de las operaciones matriciales básicas. Específicamente, se quieren encontrar 
fórmulas para det(kA), det(A + B), det(AB) det(A”?), y det(A”) en términos de det A y 
det B. 

El Teorema 4.3(d) no dice que det(kA) = k det A. La relación correcta entre la mul- 
tiplicación escalar y los determinantes está dada por el siguiente teorema. 


Teorema 4.7 


Si A es una matriz de n X n, entonces 


det(kA) = k" det A 


En el ejercicio 44 se le pide dar una demostración de este teorema. 

Por desgracia, no hay una fórmula simple para det(A + B) y, en general, det(A + 
B) + det A + det B. (Encuentre dos matrices de 2 X 2 que verifiquen esto.) En conse- 
cuencia, es una agradable sorpresa descubrir que los determinantes son bastante com- 
patibles con la multiplicación de matrices. De hecho, se tiene la agradable fórmula si- 
guiente debida a Cauchy. 
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Augustin Louis Cauchy (1789-1857) nació en París y estudió ingeniería, pero cambió a 
matemáticas debido a su pobre salud. Brillante y prolífico matemático, publicó más de 700 
artículos, muchos acerca de problemas bastante difíciles. Su nombre puede encontrarse en 
muchos teoremas y definiciones en ecuaciones diferenciales, series infinitas, teoría de 
probabilidad, álgebra y física. Es célebre por introducir el rigor en el cálculo y tender los 
cimientos de la rama de las matemáticas conocida como análisis. Políticamente conservador, 
Cauchy fue realista, y en 1830 siguió a Carlos X al exilio. Regresó a Francia en 1838, pero no 
recuperó su puesto en la Sorbona hasta que la universidad desechó su requisito de que los 
miembros del personal docente juraran lealtad al nuevo rey. 


Teorema 4.8 


Si A y B son matrices de n X n, entonces 


det(AB) = (det A)(det B) 


Demostración Considere dos casos: A invertible y A no invertible. 
Si A es invertible, entonces, por el teorema fundamental de las matrices invertibles, 
puede escribirse como un producto de matrices elementales, por ejemplo 


A=BEB E 
Entonces AB = E E, *** EB, de modo que k aplicaciones del Lema 4.5 producirán 
det(AB) = det(E,E, ** E¿B) = (det E, )(det E,) ++- (det E¿)(det B) 
Al continuar con la aplicación del Lema 4.5, se obtiene 
det(AB) = det(E,E, +: E¿)det B = (det A) (det B) 


Por otra parte, si A no es invertible, entonces tampoco lo es AB, por el ejercicio 47 de 
la sección 3.3. En consecuencia, por el Teorema 4.6, det A = 0 y det(AB) = 0. En conse- 
cuencia, det(AB) = (det A)(det B), pues ambos lados son cero. — 


Ejemplo 4.14 


2 1 5 1 
Al aplicar el Teorema 4.8 a A = | | yB = E Jl se encuentra que 


y que det A = 4, det B = 3 y det(AB) = 12 = 4-3 = (det A)(det B), como se afirmó. 
(¡Compruebe estas aseveraciones!) 


El siguiente teorema ofrece una amigable relación entre el determinante de una matriz 
invertible y el determinante de su inversa. 
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Teorema 4.9 


Si A es invertible, entonces 


Demostración Puesto que A es invertible, AA”? = I, de modo que det(AA”*) = det I = 1. 


»—> En consecuencia, (det A)(det A7*) = 1, por el Teorema 4.8, y como det A + 0 (¿por 
qué?), dividir entre det A produce el resultado. T 
> 


Ejemplo 4.15 


Verifique el Teorema 4.9 para la matriz A del ejemplo 4.14. 


Solución Calcule 


de modo que 
1 1 1 3 1 1 1 
e) E) : 
4 2 4 2 8 8 4 detA 


Comentario La belleza del Teorema 4.9 es que en ocasiones no es necesario saber 
cuál es la inversa de una matriz, sino sólo que existe, o saber cuál es su determinante. Para 
la matriz A en los dos últimos ejemplos, una vez que se sabe que det A = 4 % 0, inme- 
diatamente puede deducirse que A es invertible y que det A”? = } sin realmente calcular 
A“, 


Ahora se relacionará el determinante de una matriz A con el de su transpuesta A”. 
Dado que los renglones de A” son justo las columnas de A, evaluar det A” mediante ex- 
pansión a lo largo del primer renglón es idéntico a evaluar det A por expansión a lo largo 
de su primera columna, lo cual es posible hacer por el teorema de expansión de Laplace. 
Por tanto, se tiene el siguiente resultado. 


Teorema 4.10 


Gabriel Cramer (1704-1752) fue 
un matemático suizo. La regla que 
lleva su nombre se publicó en 
1750, en su tratado Introducción al 
análisis de las curvas algebraicas. 
Sin embargo, ya en 1730, otros 
matemáticos conocían casos 
especiales de la fórmula, entre ellos 
el escocés Colin Maclaurin (1698- 
1746), acaso el más grande de los 
matemáticos británicos que fueron 
los “sucesores de Newton”. 


Para cualquier matriz cuadrada A, 


det A = det AT 


En esta sección se deducen dos fórmulas útiles que relacionan los determinantes con la 
solución de sistemas lineales y la inversa de una matriz. La primera de ellas, la regla de 
Cramer, ofrece una fórmula para describir la solución de ciertos sistemas de n ecuacio- 
nes lineales con n variables completamente en términos de determinantes. Aunque este 
resultado es de poco uso práctico más allá de sistemas de 2 X 2, es de gran importancia 
teórica. 

Se necesitará una nueva notación para este resultado y su prueba. Para una matriz A 
de n X n y un vector b en R”, sea A¡(b) que denota la matriz obtenida al sustituir la 
¡-ésima columna de A por b. Esto es: 


Columna i 
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Teorema 4.11 


Regla de Cramer 


Sea A una matriz de n X n invertible y sea b un vector en R”. Entonces la solución 
única x del sistema Ax = b está dada por 


_ der(A,(0)) 


X ara i S 
det A P 


Demostración Las columnas de la matriz identidad I = 1, son los vectores unitarios es- 
tándar e}, €,,...,€,. Si Ax = b, entonces 


AL(x) =Aļe +: x oe e] =[4e, = Ax + Ae,] 
= [a e b = a,]=A{(b) 
Por tanto, por el Teorema 4.8, 


(detA)(detI(x)) = det(AL(x)) = det(A(b)) 


Ahora 
0 Xi 0 0 
0 1 X2 0 0 
det I(x) =|0 0 = x == 0 01=x; 
0 0 Xai 1 0 
0 Xa 0 


como puede ver al expandir a lo largo del i-ésimo renglón. Por tanto, (det A)x; = 
det(A4;(b)) y el resultado surge al dividir entre det A (que es distinto de cero, pues A es 
invertible). _ A 


Ejemplo 4.16 


Use la Regla de Cramer para resolver el sistema 


x + 2x, =2 
=x +t 4% = l1 
Solución Calcule 
t 2 2 2 1 2 
A= = 6, det(A = = det(A = 
A O E e 
=3 
Por la Regla de Cramer, 
det(A/(b)) 6 i det(A,(b)) 3 1 
“So dera 6 Y Po dera 6 2 
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Comentario Como se hizo notar anteriormente, la regla de Cramer es computacio- 
nalmente ineficiente para todos los sistemas de ecuaciones lineales, excepto los peque- 
ños, pues involucra el cálculo de muchos determinantes. El esfuerzo que se realiza para 
calcular sólo uno de dichos determinantes, usando incluso el método más eficiente, se 
emplearía mejor al usar la eliminación gaussiana para resolver directamente el sistema. 


El resultado final de esta sección es una fórmula para la inversa de una matriz en tér- 
minos de determinantes. Esta fórmula se insinuó por la fórmula para la inversa de una 
matriz de 3 X 3, que se dio sin demostración al inicio de esta sección. Por ende, se cierra 
el ciclo. 

Ahora descubra la fórmula por usted mismo. Si A es una matriz invertible de n X n, 
su inversa es la matriz (única) X que satisface la ecuación AX = I. Al resolver para X una 
columna cada vez, sea x; la ¡-ésima columna de X. Esto es: 


Por tanto, Ax; = e, y por la regla de Cramer, 


_ det (Alej)) 


Xy det A 


Sin embargo, 


¡-ésima columna 


4 


411 A ... 0 kwa Ain 
az az ... 0 ... An 
det(A/e;)) =| ' ` ` ` ` ` = (> 1y* det Aj = Ci 
aj ajz ... 1 ... Ajn 
Anı n2 0 Ann 


que es el cofactor (J, i) de A. 

Se tiene que x, = (1/det A)C;, de modo que A™' = X = (1/det A)[C;] = (1/ 
det A) [C;] 7 Con palabras: la inversa de A es la transpuesta de la matriz de cofactores 
de A, divida por el determinante de A. 


La matriz 


Ci Ca ur Cu 
[C;] = [G] = ES E l > E 
Cin Con Ai Can 


se llama adjunta (o transpuesta conjugada) de A y se denota adj A. El resultado que 
acaba de probarse puede enunciarse del modo siguiente. 
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Teorema 4.12 


Sea A una matriz de n X n invertible. Entonces 


ll 


dj A 
E ) 


Ejemplo 4.17 


Use el método de la adjunta para calcular la inversa de 
I 2. =1 

A=|2 2 4 

IL 3 3 


Solución Calcule det A = —2 y los nueve cofactores 


je Moca as ew d ea 
i 3 3 i 1 -3 id 1 3 
Ca=- 6 3  ca=+ H=- c J=- 
21 3 -3 22 1 -3 23 3 
2a =] I -=l 2 
Gi = + ¿10 Ca = =j, aos Ci = + [7 72 
La adjunta es la transpuesta de la matriz de cofactores; a saber, 
-18 10 4]? [-18 3 10 
adjA=| 3 -2 -1| =| 10 -2 -6 
10. =6 =2 4 =1 =2 
Entonces 
i ¿[8 3 10 9 3-5 
A= adj A = 10 -=2 —6|=|-5 1 3 
det A 2 i 
4 -1 -2 -2 } 1 


que es la misma respuesta que se obtuvo (con menos trabajo) en el ejemplo 3.30. f 


Demostración del teorema de expansión de Laplace 


Por desgracia no hay una demostración sencilla y breve del Teorema de Expansión de 
Laplace. La demostración que se proporciona tiene el mérito de ser relativamente di- 
recta. Se le descompone en varios pasos, el primero de los cuales es demostrar que la 
expansión por cofactores a lo largo del primer renglón de una matriz es igual que la ex- 
pansión por cofactores a lo largo de la primera columna. 


Lema 4.13 


Sea A una matriz de n X n. Entonces 


aCi + aCi + e + anin detA = anh + aC C (7) 
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Demostración Este lema se demuestra por inducción sobre n. Para n = 1, el resultado 
es trivial. Ahora suponga que el resultado es verdadero para matrices (n — 1) X (n — 1); 
esta es la hipótesis de inducción. Note que, por la definición de cofactor (o menor), todos 
los términos que contienen a}, se representan por medio del sumando a,,C;;. Por tanto, 
puede ignorar los términos que contengan a, ;. 
El ¡-ésimo sumando a la derecha de la ecuación (7) es apC} = a (1)? det A;,. 
Ahora se expande A, a lo largo del primer renglón: 


41 A3 `U Aj Ain 
Ai—1,2 Ai-13 0U Aij `U Ají 
Aia Aiti 0% Aij U itin 

Am an3 iai Anj A Ann 


El j-ésimo término de esta expansión de det A, es a,;(—1)"™} det A; ,, donde la nota- 
ción Ayr denota la submatriz de A que se obtiene al borrar los renglones k y Ly las co- 
lumnas r y s. Al combinar esto, se ve que el término que contiene a,,a,; en el lado dere- 
cho de la ecuación (7) es 


al-D0"a( =p" det Ajj1j = (=1) ana; det Ay; 


¿Cuál es el término que contiene a;,a,; en el lado izquierdo de la ecuación (7)? El fac- 
tor a,j ocurre en el ¡-ésimo sumando a,¡C,, = ay (= 1)" det Aj: Por la hipótesis de in- 
ducción, puede expandir det A, a lo largo de su primera columna: 


a `U Aj- Arji `U An 
la 0 Aj- M j+ 7 Azn 
Ai >U Qija Qij ` An 
An An, y An, jt Ann 


El i-ésimo término en esta expansión de det A4; es a, (1)79* det A}; 1, de modo que 
el término que contiene a,,a,; en el lado izquierdo de la ecuación (7) es 


e O id det Ain (=1) anaj det Aiii 


que establece que los lados izquierdo y derecho de la ecuación (7) son equivalentes. 


A continuación se demuestra la propiedad (b) del Teorema 4.3. 


Lema 4.14 


Sea A una matriz de n X n y sea B que se obtiene al intercambiar cualesquiera dos 
renglones (columnas) de A. Entonces 


det B = —det A 
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Demostración Una vez más, la demostración es por inducción sobre n. El resultado 
puede comprobarse fácilmente cuando n = 2, así que suponga que es verdadero para 
matrices (n — 1) X (n — 1). Se demostrará que el resultado es verdadero para matrices 
de n X n. Primero, pruebe que se cumple cuando se intercambian dos renglones adya- 
centes de A; por ejemplo, los renglones r y r + 1. 

Por el Lema 4.13, puede evaluar det B mediante expansión por cofactores a lo largo 
de su primera columna. El ¡-ésimo término en esta expansión es (—1)'*'b,, det B}. Si 
i + rei + r+l, entonces b, = a, y B} es una submatriz (n — 1) X (n — 1) que es idén- 
tica a Ap, excepto que se intercambiaron dos renglones adyacentes. 


411 Ai ` Ain 
ai ain Ain 
Ar+1 1 Arg12 00 Artin 
aa An n Arn 
Ani an E Ann 
Por tanto, por la hipótesis de inducción, det B,, = —detA, sii*rei*+r+l. 


Si i = r, entonces b; = 4 Y Ba = Arras 


411 A2 ` An 


Renglón i >| a411 A2 0 Arin 
0,1 42 A Arn 
an ana e Ann 


Por tanto, el r-ésimo sumando en det B es 


(=D) ba det By = (=1) arta detA a AA det A,+1,1 


De igual modo, si i = r + 1, entonces b; = a,¡, B; = A,, y el (r + 1)-ésimo sumando en 
el det B es 


e dd AA det B,+1,1 = (1%, det A, = —(-1)" a, det A, 


En otras palabras, los términos r-ésimo y (r + 1)-ésimo en la expansión por cofactores 
de la primera columna de det B son los negativos de los términos (r + 1)-ésimo y r- 
ésimo, respectivamente, en la expansión por cofactores de la primera columna de det A. 

Al sustituir todos estos resultados en el det B y usar el Lema 4.13 nuevamente, se ob- 
tiene 


n 


5 (> Da det Bi 


i=1 


det B 


> (—1) "ba det Ba + (71) +bn det Ba + (JOB, 1 det Br, 
i21 
i+rr+1 


= > (=1) ay(—det Aj) — EIA det A+11 — (1) a, det Ay, 


II II 
| | 
a 
z iM 
ds pS 
| 
anii 
= 
+ 
A 
a 
O 
= 
> 


Un niño prodigio autodidacta, 
Takakazu Seki Kówa (1642-1708), 
descendía de una familia de 
guerreros samurai. Además de 
descubrir los determinantes, escribió 
acerca de ecuaciones diofantinas, 
cuadrados mágicos y números de 
Bernoulli (antes que Bernoulli) y 
muy probablemente realizó 
descubrimientos en cálculo. 
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Esto demuestra el resultado para matrices de n X n si se intercambian renglones ad- 
yacentes. Para ver que se sustenta para intercambios arbitrarios de renglones, sólo es ne- 
cesario notar que, por ejemplo, los renglones r y s, donde r < s, pueden intercambiarse 
al realizar 2(s — r) — 1 intercambios de renglones adyacentes (vea el ejercicio 67). Puesto 
que el número de intercambios es impar y cada uno cambia el signo del determinante, el 
efecto neto es un cambio de signo, como se desea. 

La demostración para los intercambios de columna es análoga, excepto que se ex- 
pande a lo largo del renglón 1 en lugar de a lo largo de la columna 1. — 4 


Ahora se puede demostrar el teorema de expansión de Laplace. 
Demostración del Teorema 4.1 Sea B la matriz que se obtiene al mover el renglón i de A 


a la parte superior, usando ¡— 1 intercambios de renglones adyacentes. Por el Lema 4.14, 
det B = (-1)”? det A. Pero b; = a; y Bı; = Aj paraj=1,...,f. 


Ai ai Aij Ain 

4 aij Ain 
det B =| 4-11 Ai-1j Ai—i,n 
441,1 Ai+i,j Ain 

n Anj Ann 


Por tanto, 


det A = (—1)7! det B = (1) X, (~1)'"b,; det Bij 
Pl 
= (=D) Y (+1) Ya, det A; = X, (-1) Wa; det A; 
j=1 Jal 

lo que da la fórmula para la expansión por cofactores a lo largo del renglón i. 

La demostración para expansión por columna es similar e invoca el Lema 4.13, de 
modo que es posible usar expansión por columna en lugar de expansión por renglón 
(vea el ejercicio 68). — 


Como se anotó al inicio de esta sección, la historia de los determinantes antecede a la de 
las matrices. De hecho, los determinantes se introdujeron primero, de manera indepen- 
diente, por parte de Seki, en 1683, y Leibniz, en 1693. En 1748, los determinantes apare- 
cieron en el Tratado de álgebra de Maclaurin, que incluyó un tratamiento de la regla de 
Cramer hasta el caso de 4 X 4. En 1750, el mismo Cramer probó el caso general de su 
regla y la aplicó al ajuste de curvas, y en 1772 Laplace dio una demostración de su teo- 
rema de expansión. 

El término determinante no se acuñó sino hasta 1801, cuando lo usó Gauss. En 1812, 
Cauchy usó por primera vez los determinantes en el sentido moderno. De hecho, Cauchy 
fue el responsable de desarrollar mucha de la teoría temprana de los determinantes, in- 
cluidos muchos resultados importantes que se han mencionado: la regla del producto 
para determinantes, el polinomio característico y la noción de una matriz diagonaliza- 
ble. Los determinantes no fueron ampliamente conocidos sino hasta 1841, cuando Ja- 
cobi los popularizó, aunque en el contexto de funciones de varias variables, como se les 
encuentra en un curso de cálculo multivariable. (En 1850, Sylvester llamó “jacobianos” a 
ese tipo de determinantes, un término que todavía se usa en la actualidad.) 
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Gottfried Wilhelm von Leibniz (1646-1716) nació en Leipzig y estudió leyes, 
teología, filosofía y matemáticas. Probablemente es mejor conocido por 
desarrollar (con Newton, de manera independiente) las ideas principales del 
cálculo diferencial e integral. Sin embargo, sus aportaciones a otras ramas de 
las matemáticas también son impresionantes. Desarrolló la noción de 
determinante, conoció versiones de la regla de Cramer y del teorema de 
expansión de Laplace antes de que otros le dieran el crédito a ellos, y tendió 
los cimientos para la teoría de matrices mediante el trabajo que hizo sobre las 
formas cuadráticas. Leibniz también fue el primero en desarrollar el sistema 
binario de aritmética. Creía en la importancia de una buena notación y, junto 
con la notación familiar para derivadas e integrales, introdujo una forma de 
notación de subíndices para los coeficientes de un sistema lineal que en 
esencia es la que se usa en la actualidad. 


Hacia finales del siglo XIX, la teoría de los determinantes se desarrolló hasta el 
punto de que libros completos se dedicaban a ellos, incluido el Tratado elemental sobre 
los determinantes de Dodgson, en 1867, y la monumental obra en cinco volúmenes de 
Thomas Muir, que apareció a principios del siglo XX. Aunque su historia es fascinante, 
los determinantes de hoy son más de interés teórico que práctico. La Regla de Cramer 
es un método desesperadamente ineficiente para resolver un sistema de ecuaciones li- 
neales, y los métodos numéricos han sustituido cualquier uso de los determinantes en 
el cálculo de eigenvalores. Sin embargo, los determinantes se usan para dar a los estu- 
diantes una comprensión inicial de los polinomios característicos (como en las seccio- 
nes 4.1 y 4.3). 


Ejercicios 4.2 


Calcule los determinantes en los ejercicios 1-6 usando expan- —4 1 3 0 0 sen 0 
sión por cofactores a lo largo del primer renglón y la primera 9| 2 2 4 10.| send cos tan 
ió ii 1-10 —cosg send  —cosO 
1 0 3 1 0: -=2 
1.5 1 1 2.|3 3 2 b 0 0a0 
0 1 2 0 =] 1 11.0 a b 12. lb c d 
1 =i 0 1 1 0 a 0 b 0 e0 
3.|—1 0 1 4.10 1 1 
0 Al 1 0 1 I =l -03 3 =2 0 1 
La 1 2 3 we 32 a o a 
5.2 3 1 6.14 5 U LN Md 
TE 78 9 Eo AA dl E: 
Calcule los determinantes en los ejercicios 7-15 usando expan- 000a 
sión por cofactores a lo largo de cualquier renglón o columna 00 bce 
que parezca conveniente. 15. TEE 
5.2 2 1 2 3 ghd 
7.[-1 1 2 8. | —4 0 4 


300 =3 =2 =l 


En los ejercicios 16-18, calcule los determinantes de 3 X 3 in- 
dicados, usando el método del ejemplo 4.9. 


16. El determinante en el ejercicio 6 
17. El determinante en el ejercicio 8 
18. El determinante en el ejercicio 11 


19. Verifique que el método indicado en (2) concuerda con 
la ecuación (1) para un determinante de 3 X 3. 


20. Verifique que la definición (4) concuerda con la defini- 
ción de un determinante de 2 X 2 cuando n = 2. 


21. Demuestre el Teorema 4.2. [Sugerencia: una demostra- 
ción por inducción sería adecuada. ] 


En los ejercicios 22-25, evalúe el determinante dado usando 
operaciones elementales en renglón y/o columna y el Teorema 
4.3 para reducir la matriz a forma escalonada por renglones. 


22. El determinante en el ejercicio 1 
23. El determinante en el ejercicio 9 
24. El determinante en el ejercicio 13 


25. El determinante en el ejercicio 14 


En los ejercicios 26-34, use las propiedades de los determinan- 
tes para evaluar por inspección el determinante dado. Expli- 
que su razonamiento. 


1 3 1 
26.13 0 -2 27.10 -2 5 
2 2 0 0 
0 2 3 —4 
28.10 52 29.| 1 =3 -2 
gn =l 5 2 
29 4 3 
30.10 4 1 31.|-2 0 -2 
1 6 4 5 4 1 
1 0 0 0 0200 
32. 0 0 1 0 33. =9 00 O 
0O 100 0 0 0 4 
000 1 0 0 1 0 
1 0O 1 0 
34. 0.1 0 1 
1 1 0 0 
0 0 1 1 
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Encuentre los determinantes en los ejercicios 35-40, supo- 
niendo que 


abc 
d e f|=4 
g hi 
2a 2b 2c 3a =b 2c 
35.jd e f 36. |3d —e 2f 
g h i de =h 21 
d e f a+g b+h c+i 
37.ja b c 38.| d e f 
g h 1 g h 1 
2c b a 
39.12f e d 
2i h g 
a b c 
40.|2d — 3g 2e— 3h 2f- 3i 
g h i 


41. Demuestre el Teorema 4.3(a). 
42. Demuestre el Teorema 4.3(f). 
43. Demuestre el Lema 4.5. 


44. Demuestre el Teorema 4.7. 


En los ejercicios 45 y 46, use el Teorema 4.6 para encontrar 
todos los valores de k para los cuales A es invertible. 


k =k 3 
45.A=|0 k+1 1 

k -8 k-l 

k k0 
46.A=| P 4 R 

0 k k 


En los ejercicios 47-52, suponga que A y B son matrices de 
n X n con det A = 3 y det B = —2. Encuentre los determi- 
nantes indicados. 
47. det(AB) 


50. det(2A) 


48. det(A?) 
51. det(3B") 


49. det(B~'A) 
52. det( AA”) 


En los ejercicios 53-56, A y B son matrices de n X n. 
53. Demuestre que det(AB) = det(BA). 
54. Si B es invertible, demuestre que det(B”*AB) = det(A). 


55. Si A es idempotente (esto es, A? = A), encuentre todos 
los posibles valores de det(A). 

56. Una matriz cuadrada A se llama nilpotente si A” = O 
para algún m > 1. (La palabra nilpotente proviene del 
latín nil, que significa “nada”, y potere, que significa 
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“tener poder”. En consecuencia, una matriz nilpotente 
es aquella que se vuelve “nada” [esto es: la matriz cero] 
cuando se eleva a alguna potencia.) Encuentre todos los 
posibles valores de det(A) si A es nilpotente. 


En los ejercicios 57-60, use la regla de Cramer para resolver el 
sistema lineal dado. 


5.x+y=1 58.2x= y= 5 
x=y=2 x+ 3y ==] 
59. 2x + y + 3z = 1 60.x+y=z= 
yt z=1 x+y+z=2 

z=1 Y > 


En los ejercicios 61-64, use el Teorema 4.12 para calcular la in- 

versa de la matriz de coeficientes para el ejercicio dado. 

61. Ejercicio 57 62. Ejercicio 58 

63. Ejercicio 59 64. Ejercicio 60 

65. Si A es una matriz invertible de n X n, demuestre que 
adj A también es invertible y que 


eE 1 a 
(adj A) Aa (A 1) 


66. Si A es una matriz de n X n, demuestre que 
det(adj A) = (det A)" 


67. Verifique que si r < s, entonces los renglones r y s de 
una matriz pueden intercambiarse al realizar 
2(s — r) — 1 intercambios de renglones adyacentes. 


68. Demuestre que el teorema de expansión de Laplace se 
sostiene para expansión por columna a lo largo de la 
j-ésima columna. 


69. Sea A una matriz cuadrada que puede particionarse 
como 


donde P y S son matrices cuadradas. Se dice que tal matriz 
está en forma triangular (superior) en bloques. Demuestre 
que 


det A = (det P)(det S) 


[Sugerencia: intente una demostración por inducción acerca 
del número de renglones de P.] 


70. (a) Ofrezca un ejemplo para demostrar que si A puede 
particionarse como 


donde P, Q, R y S son todas cuadradas, entonces no 
necesariamente es verdadero que 


det A = (det P)(det S) — (det Q)(det R) 


(b) Suponga que A se particiona como en el inciso (a) y 
que P es invertible. Sea 


Calcule det (BA) usando el ejercicio 69 y use el re- 
sultado para demostrar que 


det A = det P det(S — RP*Q) 


[La matriz S — RP"*Q se llama complemento de 
Schur de P en A, en honor a [ssai Schur (1875- 
1941), quien nació en Bielorrusia pero pasó la 
mayor parte de su vida en Alemania. Es conocido 
principalmente por su trabajo fundamental acerca 
de la teoría de la representación de grupos, pero 
también trabajó en teoría de números, análisis y 
otras áreas. ] 

(c) Suponga que A se particiona como en el inciso (a), 
que P es invertible y que PR = RP. Demuestre que 


detA = det(PS — RQ) 


Charles Lutwidge Dodgson (1832- 
1898) es mucho mejor conocido por 
su nombre literario, Lewis Carroll, 
con el cual escribió Las aventuras de 
Alicia en el país de las maravillas y A 
través del espejo. También escribió 
muchos libros matemáticos y 
colecciones de acertijos lógicos. 


Esta viñeta se basa en el artículo 
“Lewis Carroll's Condensation 
Method for Evaluating Determi- 
nants” de Adrian Rice y Eve To- 
rrence, en Math Horizons, noviem- 
bre de 2006, pp. 12-15. Para más 
detalles acerca del método de con- 
densación, vea David M. Bressoud, 
Proofs and Confirmations: The Story 
of the Alternating Sign Matrix Con- 
jecture, MAA Spectrum Series 
(Cambridge University Press, 1999). 


Método de 
condensación 
de Lewis Carroll 


En 1866, Charles Dodgson, mejor conocido por su pseudónimo, Lewis Carroll, publicó 
su único artículo de investigación matemática. En él describió un “nuevo y breve mé- 
todo” para calcular determinantes, al que llamó “condensación”. Aunque no es muy co- 
nocido en la actualidad y se volvió obsoleto por los métodos numéricos para evaluar de- 
terminantes, el método de condensación es muy útil para cálculos manuales. Cuando no 
había calculadoras o sistemas algebraicos de cómputo, muchos estudiantes descubrieron 
que la condensación era su método de elección. Sólo requiere la habilidad para calcular 
determinantes de 2 X 2. 
Se requiere la siguiente terminología. 


Definición Si A es una matriz de n X n, con n = 3, el interior de A, denotado 


int(A), es la matriz (n — 2) X (n — 2) que se obtiene al borrar el primer renglón, el 
último renglón, la primera columna y la última columna de A. 


Se ilustrará el método de condensación para la matriz de 5 X 5 


2 Y =]. 2 Q 


1 3 1 -4 

A= 2 =l 2 1 1 
3 L =1 2 =2 

—4 1 0 1 2 


Comience por hacer A, igual a la matriz de 6 X 6 cuyas entradas son todas 1. Luego, es- 
tablezca A, = A. Es útil imaginar A, como la base de una pirámide con A, centrada en- 
cima de A. Agregue a la pirámide capas sucesivamente más pequeñas, hasta que llegar a 
una matriz de 1 X 1 en la parte superior, ésta contendrá det A. (Figura 4.9) 
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il 2 2 5 
PEE N 2 2 
Ze | (Gil 2 2 
3 1 1 A (al 


3 1 y A E 
—4 1 1 0 0 


Ahora divida cada entrada de A; por la correspondiente entrada de int(A,) para obtener 
la matriz A,. Dado que A, es toda números 1, esto significa A, = A). 

Repita el procedimiento y construya A? a partir de las submatrices de 2 X 2 de A, y 
luego divida cada entrada de A; por la correspondiente entrada de int(A,) y continúe así. 
Se obtiene: 


aS 
W 


: 5 =] yd 


ui 1 i=7 e 
-5 als alla i 
62 60 -27 
A; = E 7| 7 ajf 1 5S[|=|-30 36 -291, 
5 =ill=i sil 5 -4 e 
5 1-1 5|] 5 -4 
| 7 alli silla 6 
62/2 60/3  —27/1 31 20 -27 
A, =| =30/-1 36/2 -29/1 | =|30 18 -29 |, 
12/1 —4/-1 26/2 2 4 3 
31 201120 27 
30 18 f E n e 
As =| i30 18|]18 -29 =96 350 
12 alla 13 


Eco dE 


-6  -9% 
A; = l | = [8604], 
% 70 


A; = [8604/18] = [478] 


Como puede comprobar por otros métodos, A = 478. En general, para una matriz A de 
n X n, el método de condensación producirá una matriz A, de 1 X 1 que contiene det A. 

Claramente, el método se descompone si el interior de cualquiera de las A; contiene 
un cero, pues entonces se trataría de dividir entre cero para construir A;, ,. Sin embargo, 
puede usar cuidadosamente las operaciones elementales con renglones y columnas para 
eliminar los ceros, de modo que pueda avanzar. 


Aplicaciones geométricas 
de los determinantes 


Esta exploración revelará algunas de las sorprendentes aplicaciones de los determinantes 
a la geometría. En particular, se verá que los determinantes están estrechamente relacio- 
nados con fórmulas para área y volumen, y pueden usarse para producir las ecuaciones 
de líneas, planos y otros tipos de curvas. La mayoría de estas ideas surgieron cuando la 
teoría de los determinantes se desarrollaba como un tema por derecho propio. 


Recuerde de la Exploración: “El producto cruz” del capítulo 1, que el producto cruz de 


Uy vi 
u = | u | yv = | v | es el vector u X v definido por 
u v3 


UV; — UV) 
u X v= | uV — Uv 


UV — UWV 


Si este producto cruz se escribe como (u,v, — uzv,Je, — (uv, — uzv,Je, + (uv, — 
u,v,)e,, donde e,, e, y e, son los vectores base estándar, entonces se ve que la forma de 
esta fórmula es 


e w Y 
uXv=det|e, u Y, 


e U3 v 


si se expande a lo largo de la primera columna. (Desde luego, este no es un determinante 
propio, pues e,, e, y e, son vectores, no escalares; sin embargo, ofrece una forma útil de re- 
cordar la fórmula un tanto complicada del producto cruz. También permite el uso de las 
propiedades de los determinantes para verificar algunas de las otras propiedades del pro- 
ducto cruz.) 

Ahora se repasarán algunos de los ejercicios del capítulo 1. 
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1. Use la versión en determinantes del producto cruz para calcular u X v. 


0 3 3 0 
O A (b)u=|-—1|v=|1 
1 2 2 1 
ll 2 1 1 
(c)u=| 2|,v=|-4| (du=|1|v=|2 
3 18 1 2 
úi vı wi 
2. Siu = | u |v = | v |, yw = | w, |, demuestre que 
us v3 W3 
u Y wi 


u: (v Xw) = det| u v w, 


U3 V3 W3 


3. Use las propiedades de los determinantes (y el problema 2 anterior, si es necesario) 
para probar la propiedad dada del producto cruz. 

(a) vX u= —(u X v) (b) ux0o=0 
(c) uxu= (d) u x kv = k(u X v) 
(e) ux(v+w) =uXv+uXw (f) u:(uxv) =0yv-(uxv) =0 
(g) u-(v x w) = (u x v):-w (la identidad del triple producto escalar) 


Ahora se puede dar una interpretación geométrica de los determinantes de matrices de 
2 X 2 y 3 X 3. Recuerde que si u y v son vectores en R’, entonces el área A del paralelo- 
gramo determinado por dichos vectores está dado por A = ||u X v||. (Vea la Explora- 
ción: “El producto cruz” del capítulo 1.) 


u 
4. Sean u = | | yv= ja Demuestre que el área A del paralelogramo determi- 
u, v2 


nado por u y v está dada por 


u v 
y A= de : d 
A u Y 
b+d 
u v 
d [Sugerencia: escriba u y v como | u | y | v |. 
0 0 
Lx 5. Obtenga geométricamente la fórmula de área del problema 4 y use la figura 4.10 
did como guía. [Sugerencia: reste áreas del rectángulo grande hasta que quede el paralelo- 
Figura 4.10 gramo.] En este caso, ¿de dónde proviene el signo del valor absoluto? 
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Figura 4.12 


y 


Figura 4.11 


6. Encuentre el área del paralelogramo determinado por u y v. 


au [ij [i] 0 G-E] 


Al generalizar los problemas 4-6, considere un paralelepípedo, un sólido tridimen- 
sional que recuerda un ladrillo “inclinado”, cuyas seis caras son todas paralelogramos 
con caras opuestas paralelas y congruentes (figura 4.11). Su volumen está dado por el 
área de su base por su altura. 


7. Demuestre que el volumen VY del paralelepípedo determinado por u, v y w está 
dado por el valor absoluto del determinante de la matriz de 3 X 3 [u v w] conu, vy 
w como sus columnas. [Sugerencia: de la figura 4.11 puede ver que la altura h puede ex- 
presarse como h = llullcos 6, donde 6 es el ángulo entre u y v X w. Use este hecho para 
demostrar que Y = |u» (v X w)| y aplique el resultado del problema 2.] 


8. Demuestre que el volumen Y del tetraedro determinado por u, v y w (figura 4.12) 
está dado por 


V = ilu. (v x w)| 


[Sugerencia: de la geometría se sabe que el volumen de tal sólido es V = į (área de la 
base) (altura).] 


Ahora vea estas interpretaciones geométricas desde un punto de vista transforma- 
cional. Sea A una matriz de 2 X 2 y sea P el paralelogramo determinado por los vectores 
u y v. Considere el efecto de la transformación matricial T, sobre el área de P. Sea T,(P) 
el paralelogramo determinado por T,(u) = Au y T,(v) = Av. 


9. Demuestre que el área de T,(P) está dada por |det A|(área de P). 


10. Sea A una matriz de 3 X 3 y sea P el paralelepípedo determinado por los vectores 
u, v y w. Sea T,(P) que denota al paralelepípedo determinado por T,(u) = Au, T,(v) = 
Av y T,(w) = Aw. Demuestre que el volumen de T,(P) está dado por |det A|(volumen 
de P). 


Los problemas anteriores ilustran que el determinante de una matriz captura lo que 
hace la correspondiente transformación matricial al área o volumen de las figuras sobre 
las que actúa. (Aunque sólo se consideraron ciertos tipos de figuras, el resultado es per- 
fectamente general y puede hacerse riguroso. Eso no se hará aquí.) 
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Suponga que se dan dos puntos distintos (x,, y,) y (x, y,) en el plano. Existe una recta 
única que pasa a través de dichos puntos y su ecuación es de la forma 


ac+by+c=0 
Puesto que los dos puntos dados están sobre esta recta, sus coordenadas satisfacen esta 
ecuación. Por ende, 

ax, Fby+c=0 

ax, + byy +c=0 
Las tres ecuaciones juntas pueden verse como un sistema de ecuaciones lineales con las 


variables a, b y c. Dado que hay una solución no trivial (es decir, la recta existe), la ma- 
triz de coeficientes 


x y 1l 
X% y 1l 
%2 Ya 1l 


no puede ser invertible, por el teorema fundamental de las matrices invertibles. En con- 
secuencia, su determinante debe ser cero, por el Teorema 4.6. Al expandir este determi- 
nante se obtiene la ecuación de la recta. 


La ecuación de la recta que pasa por los puntos (x,, y,) y (x,, y,) está dada por 


gs 39 1 
A LURO 
X Ya 1 


11. Use el método descrito anteriormente para encontrar la ecuación de la recta que 
pasa por los puntos dados. 


(a) (23) y (10) (b)(12) y (4,3) 


12.Demuestre que los tres puntos (x,, y,), (x,, y,) y (x3, y3) son colineales (están en la 
misma recta) si y sólo si 


Xx y 1 
X% Y, 1|=0 
X% y; 1 


13. Demuestre que la ecuación del plano a través de los tres puntos no colineales (x,, 
Yo 21), (Xo Y» Z2) y (Xy Yz 23) está dada por 


y z 1 
Xi Y za l = 
X Y z 1 
X% Y3 z 1 


¿Qué sucede si los tres puntos son colineales? [Sugerencia: explique qué sucede cuando se 
usa reducción por renglón para evaluar el determinante.] 


Figura 4.13 


14. Demuestre que los cuatro puntos (x;, y,» 2,), (X, Y, 2), (X3, Y3, 23) Y (Xy Y 4 24) SON 
coplanares (están en el mismo plano) si y sólo si 


X Y % l 
Xx Y. Zz l 0 
X Ya zZ 1 
Xa Ya Z4 l 


Cuando los datos que surgen de la experimentación toman la forma de puntos (x, y) que 
pueden graficarse en el plano, con frecuencia es de interés encontrar una relación entre 
las variables x y y. Idealmente se querría encontrar una función cuya gráfica pase a tra- 
vés de todos los puntos. En ocasiones todo lo que se quiere es una aproximación (vea la 
sección 7.3), pero en ciertas situaciones también son posibles resultados exactos. 


15. De la figura 4.13 parece como si pudiera encontrarse una parábola que pasa a tra- 
vés de los puntos A(—1, 10), B(0, 5) y C(3, 2). La ecuación de tal parábola es de la 
forma y = a + bx + cx?. Al sustituir los puntos dados en esta ecuación, establezca un 
sistema de tres ecuaciones lineales con las variables a, b y c. Sin resolver el sistema, use el 
Teorema 4.6 para argumentar que debe tener una solución única. Luego resuelva el sis- 
tema para encontrar la ecuación de la parábola en la figura 4.13. 


16. Use el método del problema 15 para encontrar los polinomios de grado cuando 
mucho 2 que pasen a través de los siguientes conjuntos de puntos. 


(a) A(1, —1), B(2, 4), C(3, 3) (b) A(—1, 3), B(1, —1), C(3, 1) 


17. Al generalizar los problemas 15 y 16, suponga que a,, a, y a, son distintos núme- 
ros reales. Para cualquier número real b,, b, y b,, se quiere demostrar que existe una cua- 
drática única con ecuación de la forma y = a + bx + cx? que pasa a través de los puntos 
(ap b,), (a b,) y (a, b,). Haga esto para demostrar que la matriz de coeficientes del sis- 
tema lineal asociado tiene el determinante 


la e 
1 a, 4|= (a, — aya, — aya, — a) 
l a, a 


que necesariamente es distinto de cero. (¿Por qué?) 


18. Sean a,, a,, a,, y a, distintos números reales. Demuestre que 


la da Vd 
la aa 
1 2 31= (m = a)(a, — a)(a, — ay)(a, — a,)(a, — a,)(a, — a) F0 
a É œ 
la ad 


Para cualesquiera números reales b,, b,, b, y b,, use ese resultado para probar que 
existe una cúbica única con ecuación y = a + bx + cx? + dx? que pasa a través de los 
cuatro puntos (a,, b,), (a,, b,), (az, b3) y (a, b,). (No resuelva realmente para a, b, c y d.) 
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19. Sean a,, a,,..., a, n números reales. Demuestre que 


a gui 
l m G a 
2 a i ER, e 
lo E a= ]| (a = a) 
£ 1=i<j=n 
Le a 


donde 11, =;<;< (a, — a;) significa el producto de todos los términos de la forma (a; — 
a;), donde i < j y tanto i como j están entre 1 y n. [El determinante de una matriz de esta 
forma (o su transpuesta) se llama determinante de Vandermonde, en honor del mate- 
mático francés A. T. Vandermonde (1735-1796).] 

Deduzca que, para cualesquiera n puntos en el plano cuyas coordenadas x son todas 
distintas, existe un polinomio único de grado n — 1 cuyo gráfico pasa a través de los pun- 
tos dados. 
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E 1 Eigenvalores y eigenvectores de matrices 


Ahora que se definió el determinante de una matriz de n X n, puede continuar la discu- 
sión de los eigenvalores y los eigenvectores en un contexto general. Recuerde de la sec- 
ción 4.1 que A es un eigenvalor de A si y sólo si A — Al es no invertible. Por el Teorema 
4.6, esto es verdadero si y sólo si det(A — AI) = 0. Para resumir: 


Los eigenvalores de una matriz cuadrada A son precisamente las soluciones A de la 
ecuación 


det(A — AD) = 0 


Cuando se expande det(A — ÀI), se obtiene un polinomio en A, llamado polinomio 
característico de A. La ecuación det(A — AI) = 0 se llama ecuación característica de A. 


E a b dd Pa 
Por ejemplo, si A = | %) , su polinomio característico es 
c 


a— À b 


det(A — A) = ¿E dex 


[=e Md — à) — bc = X — (a + d)A + (ad — bc) 


Si A es de n X n, su polinomio característico será de grado n. De acuerdo con el teorema 
fundamental del álgebra (vea el Apéndice D), un polinomio de grado n con coeficientes 
reales o complejos tiene cuando mucho n raíces distintas. Al aplicar este hecho al poli- 
nomio característico, se ve que una matriz de n X n con entradas reales o complejas tiene 
cuando mucho n eigenvalores distintos. 

A continuación se resumirá el procedimiento que se seguirá (por ahora) para en- 
contrar los eigenvalores y eigenvectores (eigenespacios) de una matriz. 


Sea A una matriz de n X n. 


1. Calcule el polinomio característico det(A — AL) de A. 

2. Encuentre los eigenvalores de A al resolver la ecuación característica det (A — ÀI ) 
=0 para À. 

3. Para cada eigenvalor A, encuentre el espacio nulo de la matriz A — AI. Este es el 
eigenespacio E, los vectores distintos de cero de los cuales surgen los eigenvec- 
tores de A correspondientes a A. 

4. Encuentre una base para cada eigenespacio. 


Ejemplo 4.18 | Encuentre los eigenvalores y los correspondientes eigenespacios de 
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Capítulo 4 Eigenvalores y eigenvectores 


Solución Se tiene el procedimiento resaltado anteriormente. El polinomio caracterís- 


tico es 
=A 1 0 
det(A — AD) =| 0 —A 1 
2 -5 4-14 
=A 1 0 1 
==) = 
= L= A 2 4=A 


= MM — 42 + 5) — (-2) 
= =P +4M— 54 +2 


Para encontrar los eigenvalores es necesario resolver la ecuación característica det(A — 
AL) = 0 para A. El polinomio característico se factoriza como —(A — 1)%(A — 2). (El teo- 
rema del factor es útil aquí; vea el Apéndice D.) Por ende, la ecuación característica es 
(A— DA — 2) = 0, que claramente tiene soluciones A = 1 y A = 2. Dado que A = 1 
es una raíz múltiplo y A = 2 es una raíz simple, etiquételas A, = A, = 1y à =2. 
Para encontrar los eigenvectores correspondientes a A, = A, = 1, se encuentra el es- 
pacio nulo de 


=f 1 0 =] 1 0 
A-=1l= 0. =] 1 = 0 =l 1 
2 =5 4=] 2 =5. 3 
La reducción por renglones produce 
=1 1 0[0 1 0 —1[0 
[A=F]0]=| o0 -1 ıļo| — lo 1 -1|[0 
2 -5 3]0 0 0 00 


m—» (Se sabía por anticipado que debía tener al menos un renglón cero. ¿Por qué?) En conse- 


X 


cuencia, x = | x | está en el eigenespacio E} si y sólo six, — x, = 0 y x, — x, = 0. Al 


X3 


establecer la variable libre x, = t, se ve que x, = t y x, = t, de donde se tiene que 


ý 1 1 
E = t = 451 = gen| | 1 
ý 1 1 


Para encontrar los eigenvectores correspondientes a À, = 2, se encuentra el espacio 
nulo de A — 2I mediante reducción por renglones: 


-2 1 0ļ0 1 0 —ijo 
[a —21f0]=| 0 -2 ıjo|—>lo 1 -—3|0 
2 -5 2/0 0 0 0|0 
X 
De modo que x = | x | está en el eigenespacio E, si y sólo si x, = Íx, yx, = 4%. Al 
X3 
establecer la variable libre x, = t, se tiene 
it 4 i 
E, = it = 4t ł = gen ł = gen 2 
t 1 1 4 
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donde se eliminan los denominadores en la base al multiplicar por el mínimo común de- 
»—>  nominador 4. (¿Por qué esto es permisible?) 


Comentario Note que en el ejemplo 4.18 A es una matriz de 3 X 3 pero sólo tiene 
dos eigenvalores distintivos. Sin embargo, si se cuentan multiplicidades, A tiene exacta- 
mente tres eigenvalores (A = 1 dos veces y A = 2 una vez). Esto es lo que garantiza el 
teorema fundamental del álgebra. La multiplicidad algebraica de un eigenvalor es como 
su multiplicidad como una raíz de la ecuación característica. Por tanto, A = 1 tiene mul- 
tiplicidad algebraica 2 y A = 2 tiene multiplicidad algebraica 1. 

A continuación, note que cada eigenespacio tiene una base que consiste de justo un 
vector. En otras palabras, dim E, = dim E, = 1. La multiplicidad geométrica de un ei- 
genvalor A se define como dim E,, la dimensión de su correspondiente eigenespacio. 
Como verá en la sección 4.4, es importante una comparación de estas dos nociones de 


multiplicidad. 
| > 
Ejemplo 4.19 | Encuentre los eigenvalores y los correspondientes eigenespacios de 
=1. :0 1 
A=| 3 0 =3 
1.0. =1 
Solución La ecuación característica es 
=1 =A 0 1 
0 = det(A — AI) 3 À 3 a h 
= e == = = 
1 =1-=A 
1 0 -=L-=4 
= —MA? + 24) = —X (À + 2) 
Por tanto, los eigenvalores son A, = A, = 0 y A, = —2. En consecuencia, el eigenvalor 0 
tiene multiplicidad algebraica 2 y el eigenvalor —2 tiene multiplicidad algebraica 1. 
Para A, = A, = 0, se calcula 
=1 0 110 1.0 —1|0 
[A — or jo] = [A |0] = 3 0 -3|0|—>|0 0  O0|o0 
1 0 =1|0 0 0 0j0 
Xı 
de donde se tiene que un eigenvector x = | x, | en E, satisface x, = x,. Por ende, tanto 
X3 


x, como x; son libres. Al hacer x, = s y x, = t, se tiene 


t 0 1 0 1 
Ey = s = s| 1|+#0 = gen 11,0 
t 0 1 0 1 


Para À, = —2, 


1.0 1 0 
[A — (-2)1/0] =[4+21J0] =|3 2 -3ļ|0o| —> |o 1 -3l0 
1.0 0.0 
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de modo que x, = tes libre y x, = —x, = —t yx, = 3x, = 3t. En consecuencia, 
=f — — 
E, = 3t =4t8t 3 = gen. 3 
t 
Se tiene que A, = À, = 0 posee multiplicidad geométrica 2 y À, = —2 tiene multipli- 


cidad geométrica 1. (Note que la multiplicidad algebraica es igual a la multiplicidad 
geométrica para cada eigenvalor.) | 


En algunas situaciones, los eigenvalores de una matriz son muy fáciles de encontrar. 
Si A es una matriz triangular, entonces también lo es A — Al, y el Teorema 4.2 dice que 
det(A — AI) es justo el producto de las entradas diagonales. Esto implica que la ecua- 
ción característica de una matriz triangular es 


(an T A) (an z A) da ce T A) =0 


de donde se tiene inmediatamente que los eigenvalores son A, = ap A, = Ay». .., 
A, = A„„ Este resultado se resume como un teorema y se ilustra con un ejemplo. 


Teorema 4.15 


Los eigenvalores de una matriz triangular son las entradas en su diagonal principal. 


Ejemplo 4.20 


Los eigenvalores de 


2 0 0 0 
—1 1 0 0 
A= 
0 3 0 
7 4 -2 


sonA, =2,4,=1,4,=3yA, 2, por el Teorema 4.15. De hecho, el polinomio ca- 
racterístico es justo (2 — AJ(1 — A)(3 — A)N72 — A). | 


Note que las matrices diagonales son un caso especial del Teorema 4.15. De hecho, 
una matriz diagonal es tanto triangular superior como inferior. 

Los eigenvalores capturan información mucho más importante acerca del compor- 
tamiento de una matriz. Una vez se conocen los eigenvalores de una matriz, puede de- 
ducir una gran cantidad de cosas sin hacer más trabajo. El siguiente teorema es uno de 
los más importantes en este aspecto. 


Teorema 4.16 


Una matriz cuadrada A es invertible si y sólo si 0 no es un eigenvalor de A. 


Demostración Sea A una matriz cuadrada. Por el Teorema 4.6, A es invertible si y sólo 
si det A + 0. Pero det A + 0 es equivalente a det(A — 01) + 0, lo cual dice que 0 no es 
una raíz de la ecuación característica de A (esto es, O no es un eigenvalor de A). =m 


Ahora puede extender el teorema fundamental de las matrices invertibles para in- 
cluir los resultados que se han probado en este capítulo. 
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Teorema 4.17 El teorema fundamental de las matrices invertibles: versión 3 


Sea A una matriz de n X n. Los siguientes enunciados son equivalentes: 


. A es invertible. 

Ax = b tiene una solución única para todo b en R”. 

Ax = 0 sólo tiene la solución trivial. 

. La forma escalonada reducida por renglón de A es 1... 

A es un producto de matrices elementales. 

rank(A) = n 

. nulidad(A) = 0 

. Los vectores columna de A son linealmente independientes. 
Los vectores columna de A generan R”. 

Los vectores columna de A forman una base para R”. 

. Los vectores renglón de A son linealmente independientes. 
Los vectores renglón de A generan R”. 
m. Los vectores renglón de A forman una base para R”. 
n. detA +0 

o. 0 no es un eigenvalor de A. 


—T a a a e ie O aa E E o EE O E O E 


Demostración La equivalencia (a) => (n) es el Teorema 4.6, y se demostró (a) <= (0) en 
el Teorema 4.16. — 


Existen fórmulas amigables para los eigenvalores de las potencias y la inversa de una 
matriz. 


Teorema 4.18 Sea A una matriz cuadrada con eigenvalor A y eigenvector correspondiente x. 


a. Para cualquier entero positivo n, A” es un eigenvalor de A” con eigenvector correspon- 
diente x. 

b. Si A es invertible, entonces 1/4 es un eigenvalor de A7* con eigenvector correspon- 
diente x. 

c. Si A es invertible, entonces, para cualquier entero n, A” es un eigenvalor de A” con 
eigenvector correspondiente x. 


Demostración Se tiene Ax = Ax. 


(a) Se procede por inducción sobre n. Para n = 1, el resultado es el que se acaba de pro- 
porcionar. Suponga que el resultado es verdadero para n = k. Esto es, suponga que para 
algún entero positivo k, Ax = Ax. Se debe demostrar el resultado para n = k + 1. Pero 


AF IZ = A(Afx) = A(Ax) 
por la hipótesis de inducción. Al usar la propiedad (d) del Teorema 3.3, se tiene 
Ax) = M(Ax) = A(Ax) = Mx 


Por tanto, A**x = Ax, como se requiere. Por inducción, el resultado es verdadero 
para todos los enteros n = 1. 

(b) En el ejercicio 13 se le pide demostrar esta propiedad. 

(c) En el ejercicio 14 se le pide demostrar esta propiedad. DE | 


El siguiente ejemplo muestra una aplicación de este teorema. 
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Ejemplo 4.21 


10 
Calcule - a Al 
2 1 1 


LS 0 1 
Solución Sean A = f 


5 a 
'] yx= Hi entonces lo que se quiere encontrar es Ax. 


Los eigenvalores de A son A, = —1 y A, = 2, con eigenvectores correspondientes 


tyv = [ies 
= v= . Esto es, 
MI | yv 2 


Avy = =v y Av, = 2v, 


(Compruebe esto.) Dado que {v;, v,) forma una base para R? (¿por qué?), puede es- 
cribir x como una combinación lineal de v, y v,. De hecho, como se comprueba fácil- 
mente, x = 3v, + 2v,. 

En consecuencia, al usar el Teorema 4.18(a), se tiene 


AYx = AY(3v, + 2v3) = 3(4v,) + 2(4'v,) 
= 3(41")v, + 242) v 


ao 1] 00d] [t3] Los 


Ciertamente, esto es mucho más sencillo que primero calcular A*% de hecho, ¡no existen 


multiplicaciones matriciales! 


Cuando se puede usar, el método del ejemplo 4.21 es bastante general. Se le resume 
como el siguiente teorema, que se le pedirá demostrar en el ejercicio 42. 


Teorema 4.19 


Teorema 4.20 


Suponga que la matriz A de n X n tiene eigenvectores V}, Vz . . ., V,, COn correspon- 
dientes eigenvalores A,, A, ..., A, Six es un vector en R” que puede expresarse como 
una combinación lineal de estos eigenvectores, por decir, 


X= CV + OV + CV 
entonces, para cualquier entero k, 


Ax = Av, + Akv + 00: + cv, 


(CSEE) 


Advertencia El truco aquí es el “si” en la segunda oración. Absolutamente no hay 
garantía de que tal combinación lineal sea posible. La mejor situación posible sería si hu- 
biera una base de R” que consistiera de eigenvectores de A; en la siguiente sección se ex- 
plorará esta posibilidad. Sin embargo, como un paso en dicha dirección, se tiene el 
siguiente teorema, que afirma que los eigenvectores correspondientes a distintos eigen- 
valores son linealmente independientes. 


Sea A una matriz de n X n y sean A,,A,,..., À„ distintos eigenvalores de A con sus co- 
rrespondientes eigenvectores v,, V . . ., V, Entonces V}, Va . . ., V„ son linealmente in- 
dependientes. 


Demostración La demostración es indirecta. Se supondrá que v,, V» . - 
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-> V„ SOn lineal- 


mente dependientes y se demostrará que esta suposición conduce a una contradicción. 


Si Vp Vp»... 


, V„ SON linealmente dependientes, entonces uno de dichos vectores debe 


poder expresarse como una combinación lineal de los anteriores. Sea v,, , el primero de 


los vectores v, que pueden expresarse de esa forma. En otras palabras, v,, V} . . 
linealmente independientes, pero existen escalares c}, C,, ... 


. , V, SON 
-> C, tales que 


Ver] = QVI E OV Hie + Civ; (1) 


Al multiplicar por la izquierda ambos lados de la ecuación (1) por A y con el hecho de 
que Av, Av, para cada i, se tiene 


A A A A) 


= (AV, + GAV, +: + «Av, (2) 


= C¡A¡V, + OAV Sa T CA Vi 


Ahora multiplique ambos lados de la ecuación (1) por A,,, para obtener 


MreriWrrr CIA 1 Vr E CA 1 W7 ie E CA 1 Ve (3) 


Cuando se resta la ecuación (3) de la ecuación (2), se obtiene 


La independencia lineal de v}, v,, .. 


0 = c(d = Akt) Y F lA = Àk+1)V2 qaer LA = Àk+1)Vk 


-> V, implica que 


CAL = Ak) = ol — Aer) = 000 = CA — A) = 0 
Dado que los eigenvalores A, son todos diferentes, los términos entre paréntesis (À; — 
Ay+1),1= 1,...,k son todos distintos de cero. Por tanto, c, = c, =***= c, = 0. Esto im- 
plica que 


Vir = GV1 F eV He + Cor = Ovi + Ov, +++ 0v,=0 


lo que es imposible, pues el eigenvector v, ,, no puede ser cero. En consecuencia, se tiene 
una contradicción, lo cual significa que la suposición de que v,, v,,..., v,, son linealmente 


dependientes es falsa. Se tiene que v}, V}... 


, v,, deben ser linealmente independientes. 


— A 
lEjercicios 4.3 a 
En los ejercicios 1-12, calcule (a) el polinomio característico de 0 1 0 3 
A, (b) los eigenvalores de A, (c) una base para cada eigenespa- 7.A 3 2 8S.A=|2 -2 2 
cio de A y (d) la multiplicidad algebraica y geométrica de cada 0.2 3 0 
eigenvalor. 
La=| 1 al 2A=|) El 1.0.0 2 1 1 1 
a ME E = 1 0 0 0123 
o Ue 9. A 10. A = 
1 1 0 110 0 1 4 00 33 
3}A=|0 -2 1 4A=|1 0 1 a 1.2 00 02 
0 0 3 0 1 1 0 0 0 
= 1 0 0 
1 2 0 1 1 Las 
5.A=|-1 -1 1 6. A = 2 0 1 3 0 
0 1 1 =] 1 1 1.2 =] 
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1 1 1 0 

4 1 0 1 
12. A = 

0 0 =1 1 

0 0 2.0 


13. Demuestre el Teorema 4.18(b). 


14. Demuestre el Teorema 4.18(c). [Sugerencia: combine las 
demostraciones de los incisos (a) y (b) y vea el cuarto 
Comentario que sigue al Teorema 3.9 (página 175).] 


En los ejercicios 15 y 16, A es una matriz de 2 X 2 con eigen- 


1 


1 
vectores v, = | | yv, = | a que corresponden a 


5 
eigenvalores A =3 y A, = 2, respectivamente, yx = El 
15. Encuentre A'%x. 


16. Encuentre A*x. ¿Qué sucede conforme k se vuelve 
grande (esto es, k > 00)? 


En los ejercicios 17 y 18, A es una matriz de 3 X 3 con eigen- 


1 1 1 
vectores V, = | 0 |, v2 = | 1 | yv; = | 1 | correspondientes 
0 0 1 
a eigenvalores A, 3, À, = 3 yà; = 1, respectivamente, y 
2 
x=|1|. 
2 


17. Encuentre Ax. 


18. Encuentre A*x. ¿Qué sucede conforme k se vuelve 
grande (esto es, k > 00)? 


19. (a) Demuestre que para cualquier matriz cuadrada A, 
A” y A tienen el mismo polinomio característico y 
en consecuencia los mismos eigenvalores. 

(b) Dé un ejemplo de una matriz A de 2 X 2 para la 
cual A” y A tengan diferentes eigenespacios. 


20. Sea A una matriz nilpotente (esto es: A” = O para 
algún m > 1). Demuestre que A = 0 es el único eigenva- 
lor de A. 

21. Sea A una matriz idempotente (esto es, A? = A). De- 
muestre que À = 0 yA = 1 son los únicos eigenvalores 
posibles de A. 

22. Si v es un eigenvector de A con su correspondiente 
eigenvalor À y c es un escalar, demuestre que v es un 
eigenvector de A — cI con su eigenvalor correspondiente 
A= € 

23. (a) Encuentre los eigenvalores y eigenespacios de 


"E 


(b) Con el Teorema 4.18 y el ejercicio 22, encuentre los 
eigenvalores y eigenespacios de ALA — 2IyA + 21. 


24. Sean A y B matrices de n X n con eigenvalores A y u, 

respectivamente. 

(a) Ofrezca un ejemplo para demostrar que A + u no 
necesita ser un eigenvalor de A + B. 

(b) Ofrezca un ejemplo para demostrar que Au no ne- 
cesita ser un eigenvalor de AB. 

(c) Suponga que À y u corresponden al mismo eigen- 
vector x. Demuestre que, en este caso, A + yu es un 
eigenvalor de A + B y Ap es un eigenvalor de AB. 


25. Si A y B son dos matrices equivalentes por renglon, ¿ne- 
cesariamente tienen los mismos eigenvalores? Demues- 
tre que lo son u ofrezca un contraejemplo. 


Sea p(x) el polinomio 
plx) =x" + apx! +++ ax + a 


La matriz acompañante de p(x) es la matriz de n X n 


ls A 
1 0 ae. Q 0 
C(p) = 0 1 “e : ; (4) 
0 0 so Q 0 
0 0 0 


26. Encuentre la matriz acompañante de p(x) = x? — 7x + 
12 y luego encuentre el polinomio característico de 
Cp). 

27. Encuentre la matriz acompañante de p(x) = x? + 3x? — 
4x + 12 y luego encuentre el polinomio característico 
de C( p). 

28. (a) Demuestre que la matriz acompañante C( p) de p(x) 
= x? + ax + btiene polinomio característico A? + 
ad +b. 

(b) Demuestre que si A es un eigenvalor de la matriz 


A 
acompañante C( p) en el inciso (a), entonces | | es 


un eigenvector de C( p) correspondiente a À. 

29. (a) Demuestre que la matriz acompañante C( p) de p (x) 
= x% + ax? + bx + c tiene polinomio característico 
=(A + ax + bà +o). 

(b) Demuestre que, si À es un eigenvalor de la matriz 
A 
acompañante C( p) en el inciso (a), entonces | A 
1 
es un eigenvector de C( p) correspondiente a A. 
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30. Construya una matriz no triangular de 2 X 2 con eigen- 
valores 2 y 5. [Sugerencia: use el ejercicio 28.] 


31. Construya una matriz no triangular de 3 X 3 con eigen- 
valores —2, 1 y 3. [Sugerencia: use el ejercicio 29.] 


32. (a) Use inducción matemática para demostrar que, para 
n = 2, la matriz acompañante C( p) de p(x) = x” + 
a,x"! +- + a,x + a, tiene polinomio caracte- 
rístico (—1)"p(A). [Sugerencia: desarrolle por cofac- 
tores a lo largo de la última columna. Puede descu- 
brir que es útil introducir el polinomio q (x) = 
(Pœ) — a)/x] 

(b) Demuestre que si À es un eigenvalor de la matriz 
acompañante C( p) en la ecuación (4), entonces un 
eigenvector correspondiente a À está dado por 


A”! 
ArT? 
À 
1 


Si p(x) = x" + a,x"! +: + ax + a, yA es una matriz 
cuadrada, puede definir una matriz cuadrada p(A) mediante 


PA) = A" + aA"! + + aA + al 


Un importante teorema del álgebra lineal avanzada dice que 
si c (A) es el polinomio característico de la matriz A, enton- 
ces c (A) = O (en palabras, toda matriz satisface su ecua- 
ción característica). Este es el famoso teorema de Cayley- 
Hamilton, llamado así en honor de Arthur Cayley 
(1821-1895), y de sir William Rowan Hamilton. Cayley de- 
mostró este teorema en 1858. Hamilton lo descubrió, inde- 
pendientemente, en su trabajo acerca de los cuaterniones, 
una generalización de los números complejos. 


33. Verifique el teorema de Cayley-Hamilton para 


1 =1 ; : 
A= b a Esto es, encuentre el polinomio caracte- 


rístico c,(A) de A y demuestre que c,¿(A) = O. 
34. Verifique el teorema de Cayley-Hamilton para 


1 1 0 
A=|-1 0 1 
=2 1 0 


El teorema de Cayley-Hamilton puede usarse para calcular 
potencias e inversos de matrices. Por ejemplo, si A es una ma- 


triz de 2 X 2 con polinomio característico c(A) = A+ aà + 
b, entonces A? + aA + bI = O, de modo que 


A? = —aA — bI 
y A’ = AA? = A(—aA — bI) 
= —aA? — bA 


a(—aA — bI) — bA 
= (a — b)A + abl 


Es fácil ver que, al continuar de esta forma, puede expresar 
cualquier potencia positiva de A como una combinación lineal 
de I y A. A partir de A? + aA + bI = O, también se obtiene 
A(A + al) = —bL de modo que 
A`! = m7 = fr 
b b 


siempre que b + 0. 


35. Para la matriz A del ejercicio 33, use el teorema de Cay- 
ley-Hamilton para calcular, A?, A? y A* al expresar cada 
una como una combinación lineal de I y A. 


36. Para la matriz A del ejercicio 34, use el teorema de Cay- 
ley-Hamilton para calcular A? y A* al expresar cada una 
como una combinación lineal de I, A y A?. 


37. Para la matriz A del ejercicio 33, use el teorema de Cay- 
ley-Hamilton para calcular A7* y A”? al expresar cada 
una como una combinación lineal de I y A. 


38. Para la matriz A del ejercicio 34, use el teorema de Cay- 
ley-Hamilton para calcular A7* y A? al expresar cada 
una como una combinación lineal de I, A y A?. 


39. Demuestre que si la matriz cuadrada A puede partirse 
como 


donde P y S son matrices cuadradas, entonces el polinomio 
característico de A es c,(A) = cp(A)c; (A). [Sugerencia: use el 
ejercicio 69 de la sección 4.2.] 


40. Sea A,,A,,..., A, un conjunto completo de eigenvalores 
(incluidas repeticiones) de la matriz A de n X n. De- 
muestre que 


det(A) = Ad: A, Y 
tr(A) =A +A Hee An 


[Sugerencia: el polinomio característico de A se factoriza 
como 


det(A — AI) = (DA AAA) (AA) 
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Encuentre el término constante y el coeficiente de A”7* que el producto de todos los eigenvalores de AB es 
en los lados izquierdo y derecho de esta ecuación.] el producto de todos los eigenvalores de A y B 


41. Sean A y B matrices de n X n. Demuestre que la suma 
de todos los eigenvalores de A + B es la suma de 


individualmente. (Compare este ejercicio con el 
ejercicio 24.) 


todos los eigenvalores de A y B individualmente. Pruebe 42. Pruebe el Teorema 4.19. 


Semejanza y diagonalización 


Como vio en la última sección, las matrices triangulares y diagonales son agradables en 
el sentido de que sus eigenvalores se muestran con transparencia. Sería agradable si pu- 
diera relacionarse una matriz cuadrada dada con una triangular o diagonal en tal forma 
que tuvieran exactamente los mismos eigenvalores. Desde luego, ya conoce un procedi- 
miento para convertir una matriz cuadrada en forma triangular, a saber, la eliminación 
gaussiana. Por desgracia, este proceso no conserva los eigenvalores de la matriz. En esta 
sección se considera un tipo diferente de transformación de una matriz que se comporta 
bien con respecto a los eigenvalores. 


Definición Sean A y B matrices de n X n. Se dice que A es semejante a B si existe 
una matriz invertible P de n X n tal que P™'AP = B. Si A es semejante a B, se escribe 
AB. 


Comentarios 

e Si A — B, puede escribir, de modo equivalente, que A = PBP™' o AP = PB. 

+ La semejanza es una relación entre matrices en el mismo sentido que “menor que 
o igual a” es una relación entre enteros. Note que en la definición hay una dirección (u 
orden) implícita. Como a < b no necesariamente implica b < a, no debe suponer que 
A ~ B implica B ~ A. (De hecho, esto es cierto, como se demostrará en el siguiente teo- 
rema, pero no se deduce inmediatamente de la definición.) 

+ La matriz P depende de A y B. No es única para un par dado de matrices A y B 
similares. Para ver esto, simplemente tome A = B = I, en cuyo caso I ~ I, pues PYP = I 
para cualquier matriz invertible P. 


Ejemplo 4.22 


1 2 1 0 
Sea A = | y = p Y |. Entonces A ~ B, dado que 


a TRE el E 


1 1 
Por tanto, AP = PB con P = E l (Note que no es necesario calcular P”*. Vea el 


primer Comentario en la página anterior.) ) 
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Teorema 4.21 


Sean A, B y C matrices de n X n. 


a AA 
b. Si A ~ B, entonces B ~ A. 
c SiA~ Byb- C entonces Aka 


Demostración (a) Esta propiedad surge del hecho de que IAI = A. 


(b) Si A ~ B, entonces P7'AP = B para alguna matriz invertible P. Como se hizo notar 
en el primer Comentario de la página anterior, esto es equivalente a PBP"* = A. Al hacer 
Q = P”?, se tiene Q7'BQ = (P"*) "BP"! = PBP"* = A. Por tanto, por definición, 
B=A. 


(c) En el ejercicio 30 se le pide demostrar la propiedad (c). 


Comentario Cualquier relación que satisfaga las tres propiedades del Teorema 4.21 
se llama relación de equivalencia. Las relaciones de equivalencia surgen frecuentemente 
en matemáticas, y los objetos que se conectan vía una relación de este tipo por lo gene- 
ral comparten propiedades importantes. Está a punto de ver que esto también es cierto 
para las matrices semejantes. 


Teorema 4.22 


Sean A y B matrices de n X n con A ~ B. Entonces 


a. det A = det B 

b. A es invertible si y sólo si B es invertible. 

c. A y B tienen el mismo rank. 

d. A y B tienen el mismo polinomio característico. 
e. A y B tienen los mismos eigenvalores. 


Demostración Se demuestran (a) y (d) y las propiedades restantes se dejan como ejer- 
cicios. Si A ~ B, entonces P”'AP = B para alguna matriz invertible P. 


(a) Al tomar determinantes de ambos lados, se tiene 


det B = det(P"AP) = (det P™')(det A)(det P) 


= (Jia Al det P) = det A 


(d) El polinomio característico de B es 


det(B — A) = det(P "AP — Al) 


(P 
det(P"AP — APP) 
(P 


det(P7lAP — P~'(AI)P) 


det(P"'"(A — AP) = det(A — Al) 


y el último paso procede como en (a). Por tanto, det(B — AI) = det(A — AT); esto es, los 
polinomios característicos de B y A son los mismos. _ 
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Comentario Dos matrices pueden tener en común las propiedades (a) a (e) 


1.0 1 1 
(y más) y aún así no ser semejantes. Por ejemplo, A = E j | yB = h i | tienen de- 
terminante 1 y rank 2, son invertibles y tienen polinomio característico (1 — A)? y eigen- 
valores A, = À, = 1. Pero A no es semejante a B, pues P"'AP= P"'IP=1 + B para cual- 
quier matriz invertible P. 


El Teorema 4.22 es más útil para demostrar que dos matrices no son semejantes, pues 
A y B no pueden ser semejantes si falla alguna de las propiedades de la (a) a la (e). 


Ejemplo 4.23 


I -2 2 1 
(a) A = | | yB = | 2] no son semejantes, pues det A = —3 pero det B = 3. 
1.3 1 1 ] , : . 
(b) A = | | yB= |; B A no son semejantes, pues el polinomio característico 


de A es à? — 34 — 4 mientras que el de B es à? — 4. (Compruébelo.) Sin embargo, note 
que A y B tienen los mismos determinante y rank. | 


La mejor situación posible es cuando una matriz cuadrada es semejante a una matriz 
diagonal. Como está a punto de ver, el que una matriz sea diagonalizable está estrecha- 
mente relacionado con los eigenvalores y eigenvectores de la matriz. 


Definición Una matriz A de n X n es diagonalizable si existe una matriz diago- 
nal D tal que A sea semejante a D; esto es, si existe una matriz invertible P de n X n tal 
que P"'AP = D. 


> 


Ejemplo 4.24 


1 3 1 3 4 0 
A= es diagonalizable pues, si P = | yD= | | entonces P'AP = D, 
2 2 l: +=2 0. =] 
como puede comprobarse fácilmente. (En realidad, es más rápido comprobar el enun- 
ciado equivalente AP = PD, pues no requiere encontrar P”!.) 


El ejemplo 4.24 plantea la pregunta de dónde pueden provenir las matrices P y D. 
Observe que las entradas diagonales 4 y —1 de D son los eigenvalores de A, pues son las 
raíces de su polinomio característico, que se encontró en el ejemplo 4.23(b). El origen de 
la matriz P es menos obvio, pero, como está a punto de demostrarse, sus entradas se ob- 
tienen de los eigenvectores de A. El Teorema 4.23 precisa esta conexión. 


Teorema 4.23 


Sea A una matriz de n X n. Entonces A es diagonalizable si y sólo si A tiene n eigen- 
vectores linealmente independientes. 

Más precisamente, existe una matriz invertible P y una matriz diagonal D tales que 
P'AP = D si y sólo si las columnas de P son n eigenvectores linealmente independien- 
tes de A y las entradas de la diagonal de D son los eigenvalores de A correspondientes a 
los eigenvectores en P en el mismo orden. 
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Demostración Suponga primero que A es similar a la matriz diagonal D vía P”|AP= D 


o, de manera equivalente, AP = PD. Sean p}, P» . - - , P, las columnas de P y sean A,, 
Az) «+ + > A, las entradas de la diagonal de D. Entonces 
Aj 0 > 0 
IN Po 0 Pa] ES ha a (1) 
0.0 -- A, 
o [Api Ap, ++ Ap] S [API Ap ++ APh] (2) 


donde el lado derecho es justo la representación columna-renglón del producto PD. Al 
igualar las columnas se tiene 


AP, = Ap AP? = Ap) - - -o APn = AnD 
lo que demuestra que los vectores columna de P son eigenvectores de A cuyos eigenvalo- 
res correspondientes son las entradas diagonales de D en el mismo orden. Dado que P es 
invertible, sus columnas son linealmente independientes, por el teorema fundamental de 
las matrices invertibles. 
Por el contrario, si A tiene n eigenvectores linealmente independientes p4, P» ...>P, 
con eigenvalores correspondientes À}, A), ..., Àp respectivamente, entonces 


AP, = AP Ap, = AP» - - -o AP = AnP 


Esto implica a la ecuación (2) anterior, que es equivalente a la ecuación (1). En conse- 
cuencia, si se toma P como la matriz de n X n con columnas p}, P» .- -> P, entonces la 
ecuación (1) se convierte en AP = PD. Dado que las columnas de P son linealmente in- 
dependientes, el teorema fundamental de las matrices invertibles implica que P es inver- 
tible, de modo que P7'AP = D; esto es, A es diagonalizable. E 


Ejemplo 4.25 


Si es posible, encuentre una matriz P que diagonalice 


0 1 0 
A=]J|0 0 1 
2 =5 4 


Solución Esta matriz se estudió en el ejemplo 4.18, donde se descubrió que tiene ei- 
genvalores A, = À, = 1 y À, = 2. Los eigenespacios tienen las siguientes bases: 


1 
Para à = A, = 1, Ẹ tiene base | 1 |. 
1 
1 
Para A, = 2, E, tiene base | 2 |. 
4 


Dado que todos los demás eigenvectores son sólo múltiplos de uno de estos dos vectores 
base, no puede haber tres eigenvectores linealmente independientes. En consecuencia, 
por el Teorema 4.23, A no es diagonalizable. | 


> 


Ejemplo 4.26 


Si es posible, encuentre una matriz P que diagonalice 
=1 0 1 

A=| 3 0 -3 

1 0 -1 


316 Capítulo 4  Eigenvalores y eigenvectores 


Solución Esta es la matriz del ejemplo 4.19. Ahí se descubrió que los eigenvalores de A 


son A, = A, = 0 y À, = —2, con las siguientes bases para los eigenespacios: 
0 1 
Para A; = A, = 0, E, tiene base p, = | 1 |yp»=|0|. 
0 1 
=1 
Para A, = —2, E_, tiene base pz = 31. 
1 


Se comprueba directamente que estos tres vectores son linealmente independientes. Por 
tanto, si se tiene 


00 0 
PIAP=10 0 O|=D 
0 0 -2 


como puede comprobarse fácilmente. (Si hace la comprobación a mano, es mucho más 
fácil comprobar la ecuación equivalente AP = PD.) 
Comentarios 


e Cuando existan suficientes eigenvectores, pueden colocarse en las columnas de P 
en cualquier orden. Sin embargo, los eigenvalores provendrán de la diagonal de D en el 
mismo orden que sus correspondientes eigenvectores en P. Por ejemplo, si hubiera 


elegido 
0. =l 
P=[pi ps p.]=|1 3 0 
0 
entonces habría encontrado 
0 00 
P'AP=|0 -2 0 
0 00 


+ Enel ejemplo 4.26 se le pidió comprobar que los eigenvectores p4, P» y p; eran li- 
nealmente independientes. ¿Era necesario comprobar esto? Se sabía que {p,, p,) era 
linealmente independiente, pues era una base para el eigenespacio Ep. También se sabía 
que los conjuntos {pP}, P3} y {P> ps} eran linealmente independientes, por el Teorema 
4.20. Pero a partir de esta información no se podía concluir que {p}, P» ps} era lineal- 
mente independiente. Sin embargo, el siguiente teorema garantiza que la independencia 
lineal se conserva cuando se combinan las bases de diferentes eigenespacios. 


Teorema 4.24  SeaA una matriz de n X n y sean A, À» ..., Ay distintos eigenvalores de A. Si B,es una 


base para el eigenespacio E, , entonces B = B,UB,U +++ UB, (es decir, la colección 
total de vectores base para todos los eigenespacios) es linealmente independiente. 
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Demostración Sea B; = [vi Vi» . . ., Vin} para i = 1,..., k. Tiene que demostrar que 
B = [Vis Viv eo -> Vins Var Vago + +> Von + + +o Via Ved + + +o Vin) 


es linealmente independiente. Suponga que alguna combinación lineal no trivial de estos 
vectores es el vector cero, por decir, 


(cvn Heet Cin Vin) + (Ey ty + C2n.V2n,) RC N a Chn, Vin) =0 


(3) 
Al denotar las sumas entre paréntesis mediante X,, X,, . . . X puede escribir la ecuación 
(3) como 
x ++ 00+x=0 (4) 
»> Ahora cada x; está en E), (¿por qué?) y por tanto o es un eigenvector correspondiente 


a À; o es 0. Pero, puesto que los eigenvalores de A, son distintos, si alguno de los factores 
x, es un eigenvector, son linealmente independientes, por el Teorema 4.20. Sin embargo, 
la ecuación (4) es una relación de dependencia lineal; esto es una contradicción. Se con- 
cluye que la ecuación (3) debe ser trivial; esto es: todos sus coeficientes son cero. Por 
tanto, B es linealmente independiente. — 


Existe un caso en el que la capacidad de diagonalización es automática: una matriz 
de n X n con n eigenvalores distintos. 


Teorema 4.25 Si A es una matriz de n X n con n eigenvalores distintos, entonces A es diagonaliza- 


ble. 


Demostración Sean v,, V}, . . . , V, eigenvectores correspondientes a los n eigenvalores 
»=> distintos de A. (¿Por qué no podría haber más que n de tales eigenvectores?) Por el Teo- 
rema 4.20, V}, V» . . ., V, son linealmente independientes, de modo que, por el Teorema 
4.23, A es diagonalizable. — A 


Ejemplo 4.27 | La matriz 


Ze = 7 
AÁ=|0 5 1 
0 0 —1 
tiene eigenvalores A, = 2, À = 5 y A, = —1, por el Teorema 4.15. Dado que existen tres 


eigenvalores distintos para una matriz de 3 X 3, A es diagonalizable, por el Teorema 4.25. 
(Si en realidad requiere una matriz P tal que P™'AP sea diagonal, deberá calcular bases 
para los eigenespacios, como en el ejemplo 4.19 y el ejemplo 4.26 anteriores.) 


El teorema final de esta sección es un importante resultado que caracteriza a las matri- 
ces diagonalizables en términos de las dos nociones de multiplicidad que se introdujeron 
después del ejemplo 4.18. Ofrece condiciones precisas con las cuales una matriz de n X n 
puede ser diagonalizable, aun cuando tenga menos de n eigenvalores, como en el ejemplo 
4.26. Primero se prueba un lema que verifica si una matriz es o no diagonalizable. 


Lema 4.26 Si A es una matriz de n X n, entonces la multiplicidad geométrica de cada eigenvalor 
es menor o igual que su multiplicidad algebraica. 
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Demostración Suponga que A, es un eigenvalor de A con multiplicidad geométrica p; 
esto es, dim E,, = p. De manera específica, sea E,, que tiene base B, = [V,, V» ... > Vp} 
Sea Q cualquier matriz invertible de n X n que tenga v,, V} . . - , V, COMO sus primeras co- 
lumnas p, por ejemplo, 


Q=Í[W e V, Va e va] 


o, como una matriz particionada, 


Sea 


donde Ces p X n. 
Dado que las columnas de U son eigenvectores que corresponden a A,, AU = ÀU. 
También se tiene 


pa =4=09= Ary = EA 


de donde se obtiene CU = 1,, CV = O, DU = O y DV = I,- Por tanto, 


a C , CAU | CAV ACU | CAV Ail, | CAV 
QUO = oa = | o = o a 
D DAU | DAV ADU | DAV O | DAV 


Por el ejercicio 69 de la sección 4.2, se tiene que 
det(Q7'AQ — A) = (A, — A} det(DAV — M) (5) 


Pero det (Q7'AQ — AI) es el polinomio característico de Q7*AQ, que es igual que el po- 
linomio característico de A, por el Teorema 4.22(d). Por tanto, la ecuación (5) implica 
que la multiplicidad algebraica de A, es al menos p, su multiplicidad geométrica. 

— A 


Teorema 4.27 


El teorema de diagonalización 


Sea A una matriz de n X n cuyos distintos eigenvalores son A,, A, . . . , Aj. Los si- 
guientes enunciados son equivalentes: 


a. A es diagonalizable. 

b. La unión B de las bases de los eigenespacios de A (como en el Teorema 4.24) con- 
tiene n vectores. 

c. La multiplicidad algebraica de cada eigenvalor es igual a su multiplicidad geomé- 
trica. 


Demostración (a) => (b) Si A es diagonalizable, entonces tiene n eigenvectores lineal- 
mente independientes, por el Teorema 4.23. Si n; de dichos eigenvectores corresponde al 
eigenvalor A, entonces 5; contiene al menos n; vectores. (Ya se sabe que dichos n; vecto- 
res son linealmente independientes; la única cosa que puede evitar que sean una base de 
E, es que no puedan generarlo.) Por tanto, B contiene al menos n vectores. Pero, por el 
Teorema 4.24, B es un conjunto linealmente independiente en R”; por tanto, contiene 
exactamente n vectores. 


Ejemplo 4.28 
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(b) > (c) Sea d; = dim E,; la multiplicidad geométrica de A, y sea m; la multiplicidad al- 
gebraica A, de m; Por el Lema 4.26, d; S m; para i = 1,...,k. Ahora suponga que se 
cumple la propiedad (b). Entonces también se tiene 


n=d td t+ d © m +m ++ m 


Pero m, + m, +++: + m, = n, pues la suma de las multiplicidades algebraicas de los ei- 
genvalores de A es justo el grado del polinomio característico de A, a saber, n. 
Se tiene que d, + d, +++: + d, = m, + m, +++: + mp lo cual implica que 


(m — di) + (m — d,) +: + (m, — d) = 0 (6) 


Al usar nuevamente el Lema 4.26, se sabe que m; — d; = 0 para i = 1,...,k, de donde se 
puede deducir que cada sumando en la ecuación (6) es cero; esto es, m; = d; para i = 
Limas ke 

(c) = (a) Si la multiplicidad algebraica m, y la multiplicidad geométrica d; son iguales 
para cada eigenvalor A, de A, entonces B tiene d, + d, +: + d, = m, + m, + + m, 
= n vectores que son linealmente independientes, por el Teorema 4.24. Por tanto, son 
n eigenvectores linealmente independientes de A, y A es diagonalizable, por el Teo- 
rema 4.23. — — 


0 1 0 
(a) La matriz A = | 0 0 1 | del ejemplo 4.18 tiene dos eigenvalores distintos: A, = 
2 -5 4 


À, = 1y À, = 2. Dado que el eigenvalor A, = A, = 1 tiene multiplicidad algebraica 2 pero 
multiplicidad geométrica 1, A no es diagonalizable, por el teorema de diagonalización. 
(Vea también el ejemplo 4.25.) 


=1. 0 1 

(b) La matriz A = 3 0 —3 | del ejemplo 4.19 también tiene dos eigenvalores dis- 
1.0 =1 

tintos, A, = A, = 0 y A, = —2. El eigenvalor 0 tiene multiplicidades algebraica y geomé- 


trica 2, y el eigenvalor —2 tiene multiplicidades algebraica y geométrica 1. Por tanto, esta 
matriz es diagonalizable, por el teorema de diagonalización. (Esto concuerda con los ha- 


llazgos del ejemplo 4.26.) | 


Esta sección concluye con una aplicación de la diagonalización al cálculo de las po- 
tencias de una matriz. 


> 
Ejemplo 4.29 o 1 
Calcule A” si A = | | 
2 1 
Solución En el ejemplo 4.21 se descubrió que esta matriz tiene eigenvalores A, = —1 y 


1 


1 
A yv = A Se tiene (de alguno 


A, = 2, con eigenvectores correspondientes v, = | 


de los teoremas de esta sección) que A es diagonalizable y P7'AP = D, donde 


Pee v)=| 1 | y D=|” >] 


=1 2 0 2 
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Al despejar para A, se tiene A = PDP“, que facilita encontrar potencias de A. Calcule 
A? = (PDPM(PDP"") = PD(P'P)DP~' = PDIDP"* = PD?p"* 


y, por lo general, A” = PD"P™! para todo n = 1. (Debe verificar esto por inducción. Ob- 
serve que este hecho será verdadero para cualquier matriz diagonalizable, no sólo para la 
de este ejemplo.) 


Dado que 
=1 0 1)” 
llo a 
0 2 0 2” 
se tiene 
1 1ļl|(-1)" 1 1 
co 
-=1 2 0 2 11-1 2 
Ala als aa 
-1 2 o 2 13 4 
2-1)" +2” (1) + 
E 3 3 
= 2-1" + 2”t! (ia + 2”*! 
3 3 


Puesto que sólo se pidió A, esto es más de lo que necesita. Pero ahora puede simple- 
mente establecer n = 10 para encontrar 


2-1" + 910 (=1)" + 310 


AO E 3 _ |342 341 
X(=1)1 +2" ED E 682 683 
3 3 


Pa 


|Hercicios 4.4 


En los ejercicios 1-4, demuestre que A y B no son matrices se- En los ejercicios 5-7, una diagonalización de la matriz A se da 


mejantes. en la forma P™'AP = D. Mencione los eigenvalores de A y las 
a | 4 i "i | 1 °] bases para los eigenespacios correspondientes. 
3 1P 0 1 5 2 pi pi Jer l 
1 2 2 -=5 =] 1/12 ZILI 2 0 3 
e ¿pa= [3 5] 2 wa 
2 142 1 1 1 o0 -1 
2 1 4 1 0 0 6| o -1 o|o ı oļlfo -1 0 
3BA=|0 2 3|B=|-1 4 0 -! l l 2 0 ll 1 J 
0 0 4 2 3 4 3 0 0 
10 2 1 0 3 od 
4A=|0 1 2|B=]|1 2 2 0.0.0 
1 1 4 1 0 3 


1 
8 
7. | Al 
I a 
8 
6 0 
0. *=2 
0.0 


En los ejercicios 8-15, determine si A es diagonalizable y, si lo 
es, encuentre una matriz invertible P y una matriz diagonal D 


GUN -e 
GU O w 


lw Aw o= 


tales que P™'AP = D. 


1 
q 
2 
1 
10.A= |0 
0 
1 
12.4=|1 
3 
1 
1 
14. A = 
0 
0 


l 


2 0 1 0 1 
1 2 1.A=|0 1 1 
o 2 110 
0.0 1 2 
1 3 13.A=|-1 0 
o 1 1 1l 
1 1 1l 2 0 
1 0 2| 154/02 
02 1 0 0 
0 0 1 o 0 


= N U 
© 


1 

1 

0 

0 4 

0 0 
=2 0 

0 =2 


En los ejercicios 16-23, use el método del ejemplo 4.29 para 
calcular la potencia indicada de la matriz. 


16. la a 17. E a 

=4 7 1 0 
1s. | y Bl i 19. | J 

-1 2 1 2 

1 ọ il? 1 1 1 [42 
af; 0 1 21. f -1 0 

1 0 4 0 0-1 

3 1 E i l of 
at 1 0 23. f -2 2 

1 1 3 0 11 


En los ejercicios 24-29, encuentre todos los valores (reales) de k 


para los cuales A sea diagonalizable. 


1 
24. A = 

0 

k 
26.A = 

1 


Do mari 

k 0 1 

1 1 0 k 

a 27.4=|0 1 0 
0 0 1 


En 


tes. 
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1 k 0 l1 1 k 
A=|0 2 0 29 A=|1 1 k 
0 0 1 1 1 k 

. Demuestre el Teorema 4.21(c). 


. Demuestre el Teorema 4.22(b). 
. Demuestre el Teorema 4.22(c). 
. Demuestre el Teorema 4.22(e). 


. Si A y B son matrices invertibles, demuestre que AB y 


BA son semejantes. 


. Demuestre que si A y B son matrices semejantes, enton- 


ces tr(A) = tr(B). [Sugerencia: encuentre una forma de 
usar el ejercicio 45 de la sección 3.2.] 


general, es difícil demostrar que dos matrices son semejan- 
Sin embargo, si dos matrices semejantes son diagonaliza- 


bles, la tarea se vuelve más sencilla. En los ejercicios 36-39, de- 
muestre que A y B son semejantes al demostrar que son 
semejantes a la misma matriz diagonal. Luego encuentre una 
matriz invertible P tal que P™'AP = B. 


36. 


37. 


38. 


39. 


40. 


alo 


2 1 0 3 4 =53 
A=|0 -2 1|B=|1 2 -1 
0 0 1 2 2 > 
1 0 2 =3 =2 0 
A=|1 -1 1|,B= 6 5 0 
2 0 1 4 4 —1 
Demuestre que si A es semejante a B, entonces A” es se- 


mejante a B". 


. Demuestre que si A es diagonalizable, también lo es A”. 


. Sea A una matriz invertible. Demuestre que, si A es dia- 


gonalizable, también lo es A”?. 


. Demuestre que si A es una matriz diagonalizable con un 


solo eigenvalor A, entonces A es de la forma A = A. (A 
tal matriz se le llama matriz escalar.) 


. Sean A y B matrices de n X n, cada una con n eigenvalo- 


res distintos. Pruebe que A y B tienen los mismos eigen- 
vectores si y sólo si AB = BA. 


. Sean A y B matrices semejantes. Pruebe que las multipli- 


cidades algebraicas de los eigenvalores de A y B son 
iguales. 


322 Capítulo 4  Eigenvalores y eigenvectores 


46. Sean A y B matrices semejantes. Pruebe que las multipli- 
cidades geométricas de los eigenvalores de A y B son 
iguales. [Sugerencia: demuestre que si B = P'AP, en- 
tonces todo eigenvector de B es de la forma P™'v para 
algún eigenvector v de A.] 


47. Demuestre que si A es una matriz diagonalizable tal que 
todo eigenvalor de A es 0 o 1, entonces A es idempo- 


(a) Demuestre que no es posible encontrar tres vectores 
linealmente independientes v,, v,, v; en R? tales que 
AV, = V, AV, = V, y AV, = V}. 

(b) Si A es diagonalizable, ¿cuáles son las dimensiones 
de los eigenespacios E_,, E, y E,? 


50. Sea A li e 
ls DE = $ 
E c d 


tente (esto es: A? = A). 


48. Sea A una matriz nilpotente (esto es: A” = O para algún 
m > 1). Pruebe que si A es diagonalizable, entonces A 


debe ser la matriz ero. 


49. Suponga que A es una matriz de 6 X 6 con polinomio 
característico c(A) = (1 + YA — UY — AY. 


En 1824, el matemático noruego 
Niels Henrik Abel (1802-1829) de- 
mostró que una ecuación polino- 
mial general de quinto grado 
(quíntica) no se puede resolver me- 
diante radicales; esto es: no hay una 
fórmula para sus raíces en térmi- 
nos de sus coeficientes que use so- 
lamente las operaciones de suma, 
resta, multiplicación, división y 
sacar n-ésimas raíces. En un en- 
sayo escrito en 1830 y publicado 
de manera póstuma en 1846, el 
matemático francés Evariste Galois 
(1811-1832) ofreció una teoría 
más completa que establecía con- 
diciones bajo las cuales una ecua- 
ción polinominal arbitraria puede 
resolverse mediante radicales. El 
trabajo de Galois fue útil para el 
establecimiento de la rama del ál- 
gebra llamada teoría de grupos; su 
enfoque de las ecuaciones polino- 
miales ahora se conoce como teo- 
ría de Galois. 


(a) Demuestre que A es diagonalizable si (a — d)? + 
4bc > 0 y noes diagonalizable si (a — d)? + 
4bc < 0. 

(b) Encuentre dos ejemplos para demostrar que si 
(a — dy? + 4bc = 0, entonces A puede o no ser dia- 
gonalizable. 


Métodos ¡iterativos para calcular 
elgenvalores 


En este punto, el único método que se tiene para calcular los eigenvalores de una matriz 
es resolver la ecuación característica. Sin embargo, existen muchos problemas con este 
método que resultan poco prácticos excepto para los ejemplos pequeños. El primer pro- 
blema es que depende del cálculo de un determinante, que es un proceso que consume 
mucho tiempo para matrices grandes. El segundo problema es que la ecuación caracte- 
rística es polinomial, y no hay fórmulas para resolver ecuaciones polinomiales de grado 
mayor que 4 (los polinomios de grados 2, 3 y 4 pueden resolverse usando la fórmula cua- 
drática y sus análogas). Por tanto, uno se ve forzado a aproximar eigenvalores en la ma- 
yoría de los problemas prácticos. Por desgracia, los métodos para aproximar las raíces de 
un polinomio son muy sensibles a errores de redondeo y por tanto no son confiables. 

En lugar de ello, se pasa por alto el polinomio característico y se toma un enfoque di- 
ferente, al aproximar primero un eigenvector y luego usar este eigenvector para encon- 
trar el eigenvalor correspondiente. En esta sección se explorarán algunas variaciones de 
tal método, que se basa en una simple técnica iterativa. 


El método de potencia se aplica a una matriz de n X n que tiene un eigenvalor domi- 
nante k.; esto es, un eigenvalor que es mayor en valor absoluto que todos los otros ei- 
genvalores. Por ejemplo, si una matriz tiene eigenvalores —4, —3, 1 y 3, entonces —4 es 
el eigenvalor dominante, pues 4 = |—4| >|—3| = |3| = |1|. Por otra parte, una matriz 
con eigenvalores —4, —3, 3 y 4 no tiene eigenvalor dominante. 

El método de potencia avanza de manera iterativa para producir una secuencia de 
escalares que converja en A, y una secuencia de vectores que converja en el correspon- 
diente eigenvector v,, el eigenvector dominante. Por simplicidad, se supondrá que la 
matriz A es diagonalizable. El siguiente teorema es la base para el método de potencia. 
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Teorema 4.28 


Ejemplo 4.30 


Sea A una matriz diagonalizable de n X n con eigenvalor dominante A,. Entonces 
existe un vector distinto de cero x, tal que la sucesión de vectores x, definida por 


X = AX A A 


se aproxima a un eigenvector dominante de A. 


Demostración Puede suponer que los eigenvalores de A se han marcado de modo que 
Al > [2] = | =--= fA, 
Sean v}, V» . . +, V, los correspondientes eigenvectores. Dado que v,, V» . . ., V, son lineal- 


mente independientes (¿por qué?), forman una base para R”. En consecuencia, puede es- 
cribir x} como una combinación lineal de dichos eigenvectores, por ejemplo, 


Xo = C¡V] + OV ++" + Civ, 


Ahora, x, = AX, X, = Ax, = A(AX,) = 4%x, X; = Ax, = A(4x,) = A%x, y, por lo gene- 
ral, 


xX, = AXo parak = 1 


Como se vio en el ejemplo 4.21, 


AXo = cv, + cv, A NA 


, A Y An YE (1) 
= Ml cv, +0 Em Vo o+cC, E V, 
1 1 


donde se usó el hecho de que A, 4 0 
El hecho de que A, sea el eigenvalor dominante significa que cada una de las fraccio- 
nes A,/A¡, A¿/A,,..., A, /A,, es menor que 1 en valor absoluto. Por tanto, 


GIG) 
MI A? A 


todos tienden a cero conforme k — 00. Se tiene que 
x, = Afx, >Afc¡v, a medida que k > 00 (2) 


Ahora, dado que A, 4 0 y v, # 0, x tiende a un múltiplo distinto de cero de v, (esto es, 
un eigenvector que corresponde a A,) siempre que c + 0. (Esta es la condición requerida 
acerca del vector inicial x,: debe tener un componente distinto de cero c, en la dirección 
del eigenvector dominante v,.) — A 


1 1 
Aproxime el eigenvector dominante de A = ; H usando el método del Teorema 4.28. 


Se 1 kaa 
Solución Tomex, = A como el vector inicial. Entonces 


ssaa lG] L] 


Siga de esta forma para obtener los valores de x, en la tabla 4.1. 
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Tabla 4.1 
k 0 1 2 3 4 5 6 7 8 
x H '| 4 a e H hal H Fal 
* lo 2 2 6 10 22 42 86 170 
A = 0.50 1.50 0.83 1.10 0.95 1.02 0.99 1.01 
l, = 1.00 3.00 1.67 2.20 1.91 2.05 1.98 2.01 


Figura 4.14 


La figura 4.14 muestra lo que ocurre geométricamente. Se sabe que el eigenespacio 
para el eigenvector dominante tendrá dimensión 1. (¿Por qué? Vea el ejercicio 46.) Por 
tanto, es una recta que pasa por el origen en R?. Se muestran las primeras iteraciones x, 
junto con las direcciones que determinan. Parece como si las iteraciones convergieran 


i 1 ; 
sobre la línea cuyo vector director es | al Para confirmar que este es el eigenvector do- 


minante que se busca, sólo es necesario observar que la razón r, del primero al segundo 
componente de x, se acerca mucho a 1 conforme k aumenta. La segunda línea en el 
cuerpo de la tabla 4.1 da dichos valores y puede ver claramente que r, de hecho tiende 


1 
a 1. Se deduce que un eigenvector dominante de A es | | 


Una vez encontrado un eigenvector dominante, ¿cómo puede encontrar el corres- 
pondiente eigenvalor dominante? Un método es observar que si un x, tiende a un eigen- 
vector dominante de A para el eigenvalor dominante A,, entonces 


Xe = AX S AX 


Se tiene que la razón l, entre el primer componente de x,,; y el de x, tenderá a A, con- 
forme k aumente. La tabla 4.1 presenta los valores de l, y puede ver que tienden a 2, que 


es el eigenvalor dominante. 
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Hay un inconveniente con el método del ejemplo 4.30: los componentes de las itera- 
ciones x, se vuelven muy grandes muy rápidamente y pueden causar errores significati- 
vos de redondeo. Para evitar este inconveniente, puede multiplicar cada iteración por 
algún escalar que reduzca la magnitud de sus componentes. Dado que los múltiplos es- 
calares de las iteraciones ||x,|| aún convergen a un eigenvector dominante, este enfoque 
es aceptable. Existen varias formas de lograr esto. Un método más sencillo, y el que se 
usará aquí, es dividir cada x, entre el componente con el máximo valor absoluto, de 
modo que el componente más grande ahora sea 1. Este método se llama escalamiento. 
Por tanto, si m, denota el componente de x, con el máximo valor absoluto, se sustituirá 
x, con y, = (1/m,)X;. 

Este enfoque se ilustra con los cálculos del ejemplo 4.30. Para x, no hay nada que 
hacer, pues m, = 1. En consecuencia, 


mel 


1 
Luego calcule x, = A como antes, pero ahora escale con m, = 2 para obtener 


i 2 y 2 2 1 
Ahora cambian los cálculos. Tome 


aan la Abl- 
(Je les 


Los siguientes cálculos se resumen en la tabla 4.2. 


y escale para obtener 


x 1 ; 
Ahora puede ver claramente que la sucesión de vectores y, converge a E , Un el- 


genvector dominante. Más aún, la sucesión de escalares m, converge en el correspon- 
diente eigenvalor dominante A, = 2. 


Tabla 4.2 


«Lo 
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A continuación se resume este método, llamado método de potencia. 


> 
Sea A una matriz de n X n diagonalizable con un correspondiente eigenvalor domi- 


nante À}. 


1. Sea x, = y, cualquier vector inicial en R” cuyo componente más grande sea 1. 
2. Repita los siguientes pasos para k = 1,2,...: 

(a) Calcule x, = Ay, 

(b) Sea m, el componente de x, con el valor absoluto más grande. 

(c) Establezca y, = (1/m,)X,. 


Para la mayoría de las elecciones de x, m, converge en el eigenvalor dominante A, y 
y, converge en un eigenvector dominante. 


Ejemplo 4.31 


>» 
Use el método de potencia para aproximar el eigenvalor dominante y un eigenvector do- 
minante de 


0 5 =6 
A=|-4 12 -12 
=2 =2 10 
Solución Al tomar como vector inicial 
1 
Xo =|1 
I 
calcule las entradas de la tabla 4.3. 
0.50 
Puede ver que los vectores y, se aproximana | 1 y los escalares m, se aproxi- 
0.50 


man a 16. Esto sugiere que son, respectivamente, un eigenvector dominante y el eigen- 


valor dominante de A. | 


Comentarios 

e Siel vector inicial x, tiene un componente cero en la dirección del eigenvector 
dominante v; (esto es, si c = 0 en la demostración del Teorema 4.28), entonces el método 
de potencia no convergerá en un eigenvector dominante. Sin embargo, es muy probable 


Tabla 4.3 
k 0 1 2 3 4 5 6 7 
1 =1 9:33 8.62 8.12 8.03 8.01 8.00 
X; |1 —4 =19,33 17.31 16.25 16.05 16.01 16.00 
1 6 11.67 =9,00 =8.20 —8.04 =8.01 —8.00 
1 =0;17 0.48 0.50 0.50 0.50 0.50 0.50 
Yk |1 —0.67 1 1 1 1 1 1 
1 1 —0.60 =(0/32 0.50 0.50 0.50 0.50 
ml 6 =:19.33 17.31 16.25 16.05 16.01 16.00 


John William Strutt (1842-1919), 
barón Rayleigh, fue un físico 
británico que realizó grandes 
aportaciones a los campos de la 
acústica y Óptica. En 1871 
proporcionó la primera 
explicación correcta de por qué el 
cielo es azul, y en 1895 descubrió 
el gas inerte argón, por cuyo 
descubrimiento recibió el Premio 
Nobel en 1904. Rayleigh fue 
presidente de la Royal Society, de 
1905 a 1908, y se convirtió en 
rector de la Universidad de 
Cambridge en 1908. Usó los 
cocientes de Rayleigh en un 
artículo de 1873 acerca de sistemas 
vibratorios y más tarde en su libro 
The Theory of Sound. 
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que durante el cálculo de las iteraciones posteriores, en algún punto el error de redondeo 
producirá un x, con un componente distinto de cero en la dirección de v,. El método de 
potencia comenzará entonces a converger a un múltiplo de v,. (¡Este es un ejemplo en el 
que los errores de redondeo en realidad ayudan!) 

+ El método de potencia todavía funciona cuando hay un eigenvalor dominante 
repetido o incluso cuando la matriz no es diagonalizable, bajo ciertas condiciones. Puede 
encontrar detalles en la mayoría de los libros modernos acerca de análisis numérico. (Vea 
los ejercicios 21-24.) 

+ Para algunas matrices el método de potencia converge rápidamente a un eigen- 
vector dominante, mientras para otros la convergencia puede ser muy lenta. Un vistazo 
cuidadoso a la demostración del Teorema 4.28 revela por qué. Dado que |A,/A,| = 
Ià, /A | = = = |2,/A,1, si |A,/A,| está cerca de cero, entonces (A,/4,)5..., (A,/A)* 
tenderán todos a cero rápidamente. La ecuación (2) muestra entonces que x, = A*x, 
también tenderá rápidamente a Akc,v,. 

Como ilustración, considere el ejemplo 4.31. Los eigenvalores son 16, 4 y 2, de modo 
que A,/A, = 4/16 = 0.25. Dado que 0.25” = 0.00006, hacia la séptima iteración se esta- 
ría cerca de una precisión de cuatro lugares decimales. Esto es exactamente lo que se vio. 

+ Hay una forma alternativa de estimar el eigenvalor dominante A, de una ma- 
triz A en conjunción con el método de potencia. Primero, observe que si Ax =A,x, en- 


tonces 
(Ax) -x (AÀx)'x 
= = = A 


xXx xXx xXx 


La expresión R(x) = ((Ax) - x)/(x- x) se llama cociente de Rayleigh. Conforme se calcu- 
lan las iteraciones x, los sucesivos cocientes de Rayleigh R(x,) deben tender a A,. De 
hecho, para matrices simétricas, el método de cocientes de Rayleigh es aproximadamente 
el doble de rápido que el método de factor de escalamiento. (Vea los ejercicios 17-20.) 


El método de potencia ajustado y el método de potencia inverso 


El método de potencia puede ayudarlo a aproximar el eigenvalor dominante de una ma- 
triz, ¿pero qué debe hacerse si se quieren los otros eigenvalores? Por fortuna, existen mu- 
chas variaciones del método de potencia que pueden aplicarse. 

El método de potencia ajustado usa la observación de que si A es un eigenvalor de A, 
entonces À — a es un eigenvalor de A — al para cualquier escalar œ (ejercicio 22 de la 
sección 4.3). Por tanto, si A, es el eigenvalor dominante de A, los eigenvalores de A — AI 
serán 0, À, — Àp À; Z A¡...,A, — À. Entonces puede aplicar el método de potencia para 
calcular A, — A, y a partir de este valor puede encontrar A,. La repetición de este pro- 
ceso le permitirá calcular todos los eigenvalores. 


Ejemplo 4.32 


Use el método de potencia ajustado para calcular el segundo eigenvalor de la matriz A = 


1 1 
| H del ejemplo 4.30. 


Solución En el ejemplo 4.30 se encontró que A, = 2. Para encontrar A), aplique el mé- 
todo de potencia a 


=1 1 
A-=2[= 
2 =2 
1 : ; . 
Se tomará Xy = ob pero otras elecciones también funcionarán. Los cálculos se resu- 


men en la tabla 4.4. 
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Tabla 4.4 


A 


La elección de x, produjo el eigenvalor —3 después de sólo dos iteraciones. Por tanto, 
A, — A, = —3, de modo que À, = A, — 3 = 2 — 3 = -1 es el segundo eigenvalor de A. 


sed 


Recuerde de la propiedad (b) del Teorema 4.18 que, si A es invertible con eigen- 
valor A, entonces A”? tiene eigenvalor 1/A. En consecuencia, si aplica el método de po- 
tencia a A”?, su eigenvalor dominante será el recíproco del más pequeño (en magnitud) ei- 
genvalor de A. Para usar este método de potencia inverso, se siguen los mismos pasos 
que en el método de potencia, excepto que en el paso 2(a), calcule x, = A”? y; ,. (En la 
práctica en realidad no se calcula A7* explícitamente; en vez de ello, se resuelve la ecua- 
ción equivalente Ax, = y,, para x, usando eliminación gaussiana. Esto resulta ser más 
rápido.) 


Ejemplo 4.33 | Use el método de potencia inverso para calcular el segundo eigenvalor de la matriz A = 


1 1 
| el del ejemplo 4.30. 


Ss ; ] 1 
Solución Comience, como en el ejemplo 4.30, con Xy = Yo = p Para resolver Ax, = 
Yo use reducción por renglones: 
1 1 
2 0 


Al = | 


0 0 
Por tanto, x; = | l | de modo que y, = | 1 | Entonces se obtiene x, a partir de Ax, = y;: 
1 1/0 1 0| 0.5 
aeli oem 9] os 
2 Ojl © 1/=0:5 
5 i E 1 : 
Por tanto, x, = | i al y, por escalamiento, se tiene y, = | a | Al continuar, se ob- 


tienen los valores que se muestran en la tabla 4.5, donde los valores m, convergen en —1. 
Por tanto, el eigenvalor más pequeño de A es el recíproco de —1 (que también es —1). 
Esto concuerda con el hallazgo previo en el ejemplo 4.32. 


Tabla 4.5 
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T EET E E ET E 
e p pa E 


0.99 


La más versátil de las variantes del método de potencia es una que combina los dos re- 
cién mencionados. Puede usarse para encontrar una aproximación para cualquier eigen- 
valor, siempre que se tenga una aproximación cercana a dicho eigenvalor. En otras pala- 
bras, si se proporciona un escalar a, el método de potencia inverso ajustado encontrará 
el eigenvalor A de A que esté más cercano a a. 

Si A es un eigenvalor de A y æ 4 A, entonces A — al es invertible si a no es un eigen- 
valor de A y 1/(A — a) es un eigenvalor de (A — a1)”?. (Vea el ejercicio 45.) Si a está 
cerca de A, entonces 1/(A — æ) será un eigenvalor dominante de (A — al )7*. De hecho, 
si a está muy cerca de A, entonces 1/(A — a) será mucho mayor en magnitud que el si- 
guiente eigenvalor, de modo que (como se anotó en el tercer comentario después del 
ejemplo 4.31) la convergencia será muy rápida. 


Ejemplo 4.34 


Use el método de potencia inverso ajustado para aproximar el eigenvalor de 


0 5-6 
A=|-4 12 -12 
=2. =2 10 
que esté más cerca de 5. 
Solución Al ajustar, se tiene 
=3 > =6 
A=5I=|-4 7 =L 
= =72 5 


Ahora aplique el método de potencia inverso con 


1 
Xo = Yo 1 
1 
Resuelva (A — 51)x, = y, para X;: 
zI 5 —6jl 1 0 0|—0.61 
[A - 5I|y]=|-4 7 -12|1|—>|0 ı 0|-0.88 
=2 +=2 5|1 0 0 1|—0.39 
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Tabla 4.6 
k 0 1 2 3 4 5 6 7 
1 —0.61 0.41 0.47 —0.49 —0.50 —0.50 0.50 
X; 1 —0.88 —0.69 —0.89 0.95 —0.98 —0.99 1.00 
1 =0.39 0.35 —0,44 —0.48 —0.49 —0.50 0.50 
1 0.69 0.59 0.53 0.51 0.50 0.50 0.50 
Yi 1 1.00 1.00 1.00 1.00 1.00 1.00 1.00 
1 0.45 0.51 0.50 0.50 0.50 0.50 0.50 
ma 1 —0.88 —0.69 0.89 0.95 0.98 =0.99 =1.00 


Esto produce 


—0.61 i i —0.61 0.69 
x = | —0.88 |, m = —0.88 y y, w 0.88 0.88 | =|1 
—0.39 0.39 0.45 


Continúe de esta forma para obtener los valores en la tabla 4.6, de la cual se deduce que 
el eigenvalor de A más cercano a 5 es aproximadamente 5 + 1/m, = 5 + 1/(-1) = 4, lo 


que, de hecho, es exacto. | 


El método de potencia y sus variantes representan solamente un enfoque del cálculo 
de eigenvalores. En el capítulo 5 se analizará otro método con base en la factorización 
QR de una matriz. Para un tratamiento más completo de este tema, puede consultar casi 
cualquier texto acerca de métodos numéricos. 


Teorema de Gerschgorin 


En esta sección se estudiaron muchas variaciones del método de potencia para aproxi- 
mar los eigenvalores de una matriz. Todos estos métodos son iterativos y la rapidez con 
la que convergen depende de la elección del vector inicial. Si sólo tuviera alguna “infor- 
mación confidencial” acerca de la ubicación de los eigenvalores de una matriz dada, en- 
tonces podría hacerse una elección juiciosa del vector inicial y acaso acelerar la conver- 


Este teorema se le debe al 
matemático ruso S. Gerschgorin 
(1901-1933), quien lo enunció en 


1931. No recibió mucha atención gencia del proceso iterativo. 

sino hasta 1949, cuando lo resucitó Por fortuna, existe una forma de estimar la ubicación de los eigenvalores de cual- 
Olga Taussky-Todd en una nota quier matriz. El teorema del disco de Gerschgorin afirma que los eigenvalores de una 
que publicó en el American matriz de n X n (real o compleja) yacen todos dentro de la unión de n discos circulares 
Mathematical Monthly. en el plano complejo. 


Definición Sea a = [a] una matriz de n X n (real o compleja) y sea r; la suma 

de los valores absolutos de las entradas fuera de la diagonal en el ¡-ésimo renglón de 

A; esto es, r; = D) la; | El i-ésimo disco de Gerschgorin es el disco circular D; en el 
jti 


plano complejo con centro a; y radio r,. Esto es, 


D; = [zen C:|z— a] <= r;) 
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Olga Taussky-Todd (1906-1995) nació en Olmútz en el Imperio Austro-Húngaro (ahora Olmuac, 
en la República Checa). Recibió su doctorado en teoría de números por parte de la Universidad 
de Viena en 1930. Durante la Segunda Guerra Mundial trabajó para el Laboratorio Nacional de 
Física en Londres, donde investigó el problema de la trepidación en la alas de los aviones supersó- 
nicos. Aunque el problema involucraba ecuaciones diferenciales, la estabilidad de una aeronave 
depende de los eigenvalores de una matriz relacionada. Taussky-Todd recordó el teorema de 
Gerschgorin de sus estudios de posgrado en Viena y pudo usarlos para simplificar los laboriosos 
cálculos necesarios para determinar de otro modo los eigenvalores relevantes para el problema de 
la trepidación. 

Taussky-Todd se mudó a Estados Unidos en 1947 y diez años después se convirtió en la pri- 
mera mujer en obtener un nombramiento en California Institute of Technology. En su carrera 
produjo más de 200 artículos y recibió numerosos premios. Su labor fue importante para el desa- 
rrollo de la rama de las matemáticas conocida como teoría de matrices. 


Ejemplo 4.35 


> 
Bosqueje los discos de Gerschgorin y los eigenvalores para las siguientes matrices: 
2 1 E =3 
A= bLA = 
waz wal 5 


Solución (a) Los dos discos de Gerschgorin tienen centro en 2 y —3 con radios 1 y 2, 
respectivamente. El polinomio característico de A es A? + A — 8, de modo que los ei- 
genvalores son 


A=(=1 EY — 4(—8))/2 = 2.37, —3.37 


La figura 4.15 muestra que los eigenvalores están contenidos dentro de los dos discos de 
Gerschgorin. 


(b) Los dos discos de Gerschgorin tienen centro en 1 y 3, con radios |—3| = 3 y 2, res- 
pectivamente. El polinomio característico de A es A? — 4A + 9, de modo que los eigen- 
valores son 


à = (4 + Y(E4) = 49))/2 = 2+ ¿iV5 = 2 + 2.23i,2 — 2.231 


La figura 4.16 muestra la ubicación de los eigenvalores en relación con los discos de 
Gerschgorin. 


Figura 4.15 
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Figura 4.16 


Como sugiere el ejemplo 4.35, los eigenvalores de una matriz están contenidos dentro de 
sus discos de Gershgorin. El siguiente teorema verifica que esto es así. 


Teorema 4.29 


Teorema del disco de Gerschgorin 


Sea A una matriz de n X n (real o compleja). Entonces todo eigenvalor de A está con- 
tenido dentro de un disco de Gerschgorin. 


Demostración Sea A un eigenvalor de A con su correspondiente eigenvector x. Sea x; la 
entrada de x con el valor absoluto más grande, y por tanto distinta de cero. (¿Por qué?) 
Entonces Ax = Ax, cuyo ¡-ésimo renglón es 


X 


[an âp ` Ain] : = Ax; 0) Y ajx NN Ax; 


Al reordenar se tiene 


jži 
(A — a;)x; = Y ax; o À- aj= 
jži x, 
porque x; + 0. Al tomar valores absolutos y usar las propiedades de valor absoluto (vea 
el Apéndice C), se obtiene 
os la;,x;| 5 la;llx<l 
JH 


D ai ` 4X; 
jti ¡Fi 


jti j+i — 
JA ze a;l = = = = = sy la; =f; 
Xi |x| |x| |x| jži 


porque EA <= |x| para j # i. 


Esto establece que el eigenvalor A está contenido dentro del disco de Gerschgorin con 
centro en a; y radio r; 
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Comentarios 

+ Existe una versión correspondiente del teorema anterior para los discos de 
Gerschgorin cuyos radios sean la suma de las entradas fuera de la diagonal en la ¡-ésima 
columna de A. 

+ Puede demostrarse que si k de los discos de Gerschgorin están separados de los 
otros discos, entonces exactamente k eigenvalores están contenidos dentro de la unión 
de dichos k discos. En particular, si un solo disco está separado de los otros, entonces 
debe contener exactamente un eigenvalor de la matriz. El ejemplo 4.35(a) ilustra esto. 

+ Note que, en el ejemplo 4.35(a), 0 no está contenido en un disco de Gerschgorin; 
esto es, O no es un eigenvalor de A. Por tanto, sin mayores cálculos, puede deducirse que 
la matriz A es invertible por el Teorema 4.16. Esta observación es particularmente útil 
cuando se aplica a matrices más grandes, porque los discos de Gerschgorin pueden de- 
terminarse directamente de las entradas de la matriz. 


> 

Ejemplo 4.36 210 
Considere la matriz A = | 3 6 3 |. El Teorema de Gerschgorin dice que los eigen- 

2.08 


valores de A están contenidos dentro de tres discos con centro en 2, 6 y 8 y radios 1, 1 y 
2, respectivamente. Vea la figura 4.17(a). Puesto que el primer disco está separado de los 
otros dos, debe contener exactamente un eigenvalor, por el segundo Comentario poste- 
rior al Teorema 4.29. Dado que el polinomio característico de A tiene coeficientes reales, 
si tiene raíces complejas (es decir, eigenvalores de A), deben presentarse en pares conju- 
gados. (Vea el Apéndice D.) En consecuencia hay un eigenvalor real único entre 1 y 3, y 
la unión de los otros dos discos contiene dos eigenvalores (posiblemente complejos) 
cuyas partes reales se encuentran entre 5 y 10. 

Por otra parte, el primer Comentario después del Teorema 4.29 dice que los mismos 
tres eigenvalores de A están contenidos en discos con centro en 2, 6 y 8 y radios 3, 1 y 3, 
respectivamente. Vea la figura 4.17(b). Dichos discos están mutuamente separados, de 
modo que cada uno contiene un solo (y por tanto real) eigenvalor. Al combinar dichos 
resultados, se deduce que A tiene tres eigenvalores reales, uno en cada uno de los inter- 
valos [1, 3], [5, 7] y [7.5, 8.5]. (Calcule los eigenvalores reales de A para verificar esto.) 


Im Im 
A A 
47 4+ 
27 
©- Oore 
a 4 10 
—27 
—47 —4+ 
(a) (b) 


Figura 4.17 
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_« Ejercicios 4.5 


Y 


En los ejercicios 1-4, se proporciona una matriz A junto con 
una iteración X;, producida como en el ejemplo 4.30. 

(a) Use dichos datos para aproximar un eigenvector domi- 
nante cuyo primer componente sea 1 y un correspondiente ei- 
genvalor dominante. (Use precisión a tres lugares decimales.) 
(b) Compare su eigenvalor aproximado en el inciso (a) con el 
eigenvalor dominante real. 


11.2 4443 
PO ea 


[5 4 11109 
|7 4 7811 
m e 
| -3 -1 —3904 
Th 2 il a 
S e 89 


[1.5 0.5 60.625 
4.A = ,X; = 
[2.0 3.0 239.500 


En los ejercicios 5-8, se proporciona una matriz A junto con 
una iteración X,, producida usando el método de potencia, 
como en el ejemplo 4.31. 

(a) Aproxime el eigenvalor y el eigenvector dominantes al 
calcular el correspondiente m, y y,. (b) Verifique que apro- 
ximó un eigenvalor y un eigenvector de A al comparar Ay, 


con My; 
2 -3 3.667 
5.A = X; = 
-3 10 11.001 
5 2 5.530 
6.A = y 
2 -2 1.470 
4056 10.000 
7A=|-1 3 11x 0.001 
6 0 4 10.000 
1 2 -2 3.415 
s.A=|1 1 —3l,Xv 2.914 
0 -1 1 —1.207 


En los ejercicios 9-14, use el método de potencia para aproxi- 
mar el eigenvalor y el eigenvector dominantes de A. Use el vec- 
tor inicial dado x,, el número específico de iteraciones k y pre- 
cisión a tres lugares decimales. 


9.1 |! El = pros 
i s a a 


10.4= [7 Al = ¡pto 
E E 


7 2 1 
A 
35 15 1 
Hg i; El E AE E 
9 4 8 1 
ar 15 —4 Si k=5 
8 -4 9 1 
310 1 
1.A=|11 3 11x=|1|k=6 
0.13 1 


En los ejercicios 15 y 16, use el método de potencia para apro- 
ximar el eigenvalor y el eigenvector dominantes de A con una 
precisión de dos lugares decimales. Elija cualquier vector ini- 
cial que guste (¡pero tenga en mente el primer Comentario de 
la página 326!) y aplique el método hasta que el dígito en el 
segundo lugar decimal de las iteraciones deje de cambiar. 


4 1 3 12 6 -6 
15.4A=|0 2 0 16. A = 2.0 -2 
1 1 2 —6 6 12 


Los cocientes de Rayleigh se describen en el cuarto Comentario 
de la página 327. En los ejercicios 17-20, vea cómo el método de 
cocientes de Rayleigh aproxima el eigenvalor dominante más 
rápidamente que el método de potencia ordinario, calcule los 
sucesivos cocientes de Rayleigh R(x,) parai = 1,..., k para la 
matriz A de los siguientes ejercicios. 


17. Ejercicio 11 
19. Ejercicio 13 


18. Ejercicio 12 
20. Ejercicio 14 


Las matrices de los ejercicios 21-24 no son diagonalizables o 
no tienen un eigenvalor dominante (o ambos). De cualquier 
forma, aplique el método de potencia con el vector inicial dado 
Xx, y realice ocho iteraciones en cada caso. Calcule los eigenva- 
lores y eigenvectores exactos y explique qué ocurre. 


sa) [ Ja ip 
21.4 = ,Xo 22. A = sX 
0 4 =] 1 1 
4 0 1 1 
23.A=|0 4 O|xp)=|1 
0 0 1 1 
0.0.0 1 
24A=ļ|0 5 1hx=]l1 
0 0 5 1 


En los ejercicios 25-28, el método de potencia no converge en el 
eigenvalor y al eigenvector dominantes. Verifique esto usando 
el vector inicial dado x,. Calcule los eigenvalores y eigenvecto- 
res exactos y explique qué ocurre. 


aas [2 ief] 


[2 a] 


-5 1 7 1 
2.A=| 0 4 0lx%=]|1 
7 1 -5 1 
1 —1 0 1 
28.A4=|1 TO0Ls=[1 
1 -1 1 1 


En los ejercicios 29-32, aplique el método de potencia ajustado 
para aproximar el segundo eigenvalor de la matriz A en el 
ejercicio dado. Use el vector inicial dado x,, k iteraciones y 
precisión a tres lugares decimales. 

30. Ejercicio 10 


32. Ejercicio 14 


29. Ejercicio 9 
31. Ejercicio 13 


En los ejercicios 33-36, aplique el método de potencia inverso 
para aproximar, para la matriz A en el ejercicio dado, el ei- 
genvalor que es más pequeño en magnitud. Use el vector ini- 
cial dado x,, k iteraciones y precisión a tres lugares decimales. 


34. Ejercicio 10 
1 


33. Ejercicio 9 


35. Ejercicio 7, X = 


36. Ejercicio 14 


En los ejercicios 37-40, use el método de potencia inverso ajus- 
tado para aproximar, para la matriz A en el ejercicio dado, el 
eigenvalor más cercano a a. 


37. Ejercicio 9, œ = 0 38. Ejercicio 12, œ = 0 


39. Ejercicio 7, q. = 5 40. Ejercicio 13, a = —2 

El ejercicio 32 de la sección 4.3 demuestra que todo polinomio 
es (más o menos) el polinomio característico de su propia ma- 
triz acompañante. Por tanto, las raíces de un polinomio p son 
los eigenvalores de C(p). Por tanto, puede usar los métodos de 
esta sección para aproximar las raíces de cualquier polinomio 
cuando los resultados exactos no están fácilmente disponibles. 
En los ejercicios 41-44, aplique el método de potencia inverso 

ajustado a la matriz acompañante C(p) de p para aproximar 
la raíz de p más cercana a a a tres lugares decimales. 


41.p(x)=x2+2x-20=0 
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42. p(x) =x —- x- 3,a=2 

43. p(x) =x — 2x + 1,a=0 

44. p(x) =x — 5 +x+1,a=5 

45. Sea A un eigenvalor de A con su correspondiente eigen- 
vector xX. Sia % A y a no es un eigenvalor de A, demues- 
tre que 1/(A — a) es un eigenvalor de (A — a1)* con 
su correspondiente eigenvector x. (¿Por qué A — al 
debe ser invertible?) 

46. Si A tiene un eigenvalor dominante A,, demuestre que el 
eigenespacio E,, es unidimensional. 


En los ejercicios 47-50, dibuje los discos de Gerschgorin para la 
matriz dada. 


Io 2 -i 0 
il 4 4 48.|1 2i 1+i 
1 0 5 0 1-21 
4 — 31 1 2 —2 
i =1+i 0 0 
49. . ; ; 
IFz —i 5 +61 21 
1 —2i 2i —5-5i 
2 300 
1 pi 
34 30 
50.) E 
0056 5 
00 4 8 


51. Una matriz cuadrada es estrictamente diagonal domi- 
nante si el valor absoluto de cada entrada diagonal es 
mayor que la suma de los valores absolutos de las entra- 
das restantes en dicho renglón. (Vea la sección 2.5.) Use 
el teorema del disco de Gerschgorin para demostrar que 
una matriz estrictamente diagonal dominante debe ser 
invertible. [Sugerencia: vea el tercer Comentario después 
del Teorema 4.29. ] 


52. Si A es una matriz de n X n, sea ||A|| el máximo de las 

sumas de los valores absolutos de los renglones de A; 
n 
esto es || AÌ] = máx ( y [a;l ) (Vea la sección 7.2.) 
IsisnX ¡=1 

Demuestre que, si A es un eigenvalor de A, entonces 
lA] = lAl]. 

53. Sea A un eigenvalor de una matriz estocástica A (vea la 
sección 3.7). Pruebe que |A| < 1. [Sugerencia: aplique 
el ejercicio 52 a A”.] 


N O 
Ou =e 
oo 


54. Demuestre que los eigenvalores de A = 


Ni 


Aly W O O 


© 
N nie 


0 


son todos reales y ubique cada uno de estos eigenvalores 
dentro de un intervalo cerrado sobre la recta real. 
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Aplicaciones y el teorema de Perron-Frobenius 


En esta sección se explorarán varias aplicaciones de los eigenvalores y los eigenvectores. 
Comience por revisar algunas aplicaciones de los capítulos anteriores. 


En la sección 3.7 se introdujeron las cadenas de Markov y se hicieron algunas observa- 
ciones acerca de las matrices de transición (estocásticas) asociadas con ellas. En particu- 
lar, se observó que si P es la matriz de transición de una cadena de Markov, entonces P 
tiene un vector de estado estacionario x. Esto es, existe un vector x tal que Px = x. Esto 
es equivalente a decir que P tiene 1 como eigenvalor. Ahora está en posición de probar 
este hecho. 


Teorema 4.30 


Si P es la matriz de transición de n X n de una cadena de Markov, entonces 1 es un ei- 
genvalor de P. 


Demostración Recuerde que toda matriz de transición es estocástica; por tanto, cada 
una de sus columnas suma 1. En consecuencia, si j es un vector renglón que consiste de 
n números 1, entonces jP = j. (Vea el ejercicio 13 de la sección 3.7.) Al tomar transpues- 
tas se tiene 


PI" = (py = j" 


lo que implica que j” es un eigenvector de P” con correspondiente eigenvalor 1. Por el 
ejercicio 19 de la sección 4.3, P y P” tienen los mismos eigenvalores, de modo que 1 tam- 
bién es un eigenvalor de P. — 


De hecho, es verdadero mucho más. Para la mayoría de las matrices de transición, 
todo eigenvalor A satisface |A| S 1 y el eigenvalor 1 es dominante; esto es, si A # 1, en- 
tonces |A| < 1. Son necesarias las siguientes dos definiciones: una matriz se llama posi- 
tiva si todas sus entradas son positivas, y una matriz cuadrada se llama regular si alguna 


1 ci 3 1 
2 es positiva, pero B = 2 no 


3 
de sus potencias es positiva. Por ejemplo, A = | 0 


2 


11 3 
lo es. Sin embargo, B es regular, pues B? = | 6 s es positiva. 


Teorema 4.31 


Sea P una matriz de transición de n X n con eigenvalor A. 


a. A = 1 
b. Si P es regular y A + 1 entonces |A| < 1. 


Demostración Como en el Teorema 4.30, el truco para demostrar este teorema es usar 
el hecho de que P” tiene los mismos eigenvalores que P. 


(a) Sea x un eigenvector de P” correspondiente a A y sea x, el componente de x con el 
valor absoluto más grande m. Entonces |x] < lx = m para i = 1,2,...,n. Al comparar 
los k-ésimos componentes de la ecuación Px = Ax, se tiene 


PrrX E PX ++ + PukXn = ÀX 
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(Recuerde que los renglones de P” son las columnas de P.) Al tomar valores absolutos, se 
obtiene 


Alm = [Alla] = [Ax = [Prix + Parta + +0 + ParX 


S [piil + [Pax + +++ + [Prol 

= plx] + Pall + o + Pular] (1) 
S pn + pam + + Pum 

= (Pir t Px t'o + pu)m=m 


La primera desigualdad es consecuencia de la desigualdad del triángulo en R, y la última 
igualdad proviene del hecho de que los renglones de P” suman 1. Por tanto, |Ajm = m. 
Después de dividir entre m, se tiene [A] 5 1, como se deseaba. 


(b) Se demostrará la implicación equivalente: si |A| = 1, entonces A = 1. Primero, se de- 
muestra que es verdadero cuando P (y por tanto P”) es una matriz positiva. Si|A| = 1, en- 
tonces todas las desigualdades de las ecuaciones (1) en realidad son igualdades. En par- 
ticular, 


Prrl%l + pakol + + PpxlXpl = pumn + pam + + + pum 


De manera equivalente, 


pulm = |xi]) + palm = bol) +++ palm — [x, 1) = 0 Q) 


Ahora, dado que P es positiva, p > 0 para i =1,2,..., n. Además, m — |x| = 0 para 
1=1,2,...,mn. Por tanto, cada sumando en la ecuación (2) debe ser cero, y esto sólo 
puede ocurrir si |x] = m para i = 1,2,..., n. Más aún, se tiene la igualdad en la Desi- 
gualdad del Triángulo en R si y sólo si todos los sumandos son positivos o todos son ne- 
gativos; en otras palabras, que todos los p;,x, tenga el mismo signo. Esto implica que 


m =m 
m =m 

x= =m o x= p = —mj' 
m =m 


donde j es un vector renglón de n números 1, como en el Teorema 4.30. Por tanto, en 
cualquier caso, el eigenespacio de P” correspondiente a A es E, = gen(j”). 
Pero, al usar la demostración del Teorema 4.30 se ve que j" = P” j" = Aj” y, al com- 
parar componentes, se encuentra que A = 1. Esto maneja el caso donde P es positivo. 
Si P es regular, entonces alguna potencia de P es positiva, por ejemplo, P*. Se tiene 
que P**! también debe ser positivo. (¿Por qué?) Dado que A y A**! son eigenvalores de 
P* y PE, respectivamente, por el Teorema 4.18 recién se probó que A* = A**! = 1. Por 
tanto, AX(A — 1) = 0, lo cual implica que A = 1, pues A = 0 es imposible si|A| = 1. 
—— 


Ahora es posible explicar parte del comportamiento de las cadenas de Markov que se 
observaron en el capítulo 3. En el ejemplo 3.64 se vio que, para la matriz de transición 


0.7 A 
P= 
0.3 0.8 
ENE 0.6 
y vector de estado inicial x} = Gall los vectores de estado x, convergen en el vector x = 


0.4 , A ? ; e 
f al un vector de estado estacionario para P (es decir: Px = x). A continuación se 


demostrará que, para cadenas de Markov regulares, esto siempre sucede. De hecho, se de- 


Capítulo 4  Eigenvalores y eigenvectores 


mostrará mucho más. Recuerde que los vectores de estado x, satisfacen x, = P*x,. In- 
vestigue lo que ocurre a las potencias P* cuando K se vuelve grande. 


Ejemplo 4.37 


> 
. o, 0.7 0.2]. py PoR 
La matriz de transición P = 3 0 a tiene ecuación característica 
0.7-A 0.2 
0 = det(P — A) = = X — 1514 + 0.5 = (A — (A — 0.5 
el ) 0.3 0.8 — l ( IM ) 


de modo que sus eigenvalores son A, = 1 y A, = 0.5. (Note que, gracias a los Teoremas 
4.30 y 4.31, se sabía por anticipado que 1 sería un eigenvalor y el otro eigenvalor sería 
menor que 1 en valor absoluto. Sin embargo, todavía es necesario calcular A,.) Los eigen- 


espacios son 
2 1 
E, = gen 3 y Eos = gen -1 


2 
3 


1 


=D. D 
0 A di 


1 
De este modo, al tomar Q = | a se sabe que Q'PQ = | 


acuerdo con el método utilizado en el ejemplo 4.29 de la sección 4.4, se tiene 


ed T 


Ahora, a medida que k — 00, (0.5) > 0, de modo que 
O 0 x [2  1|1 oļlf2 1]? [0.4 0.4 
D> y P> = 
0 0 3 =1/JL0 “OUL3. =l 0.6 0.6 
(Observe que las columnas de esta “matriz límite” son idénticas y cada una es un vector 


a 
de estado estacionario para P.) Ahora sea Xy = | a] cualquier vector de probabilidad ini- 


cial (es decir: a + b = 1). Entonces 


=y > sea E pa + a i lol 
“=> los osle]  Lo6a+0.6b] Los 


No sólo explica lo que se vio en el ejemplo 3.64, también dice que los vectores de estado 


i ; 0.4 : : 
X, ¡convergen en el vector de estado estacionario x = | 6 para cualquier elección 


de Xp! 


No hay nada especial en el ejemplo 4.37. El siguiente teorema demuestra que este 
tipo de comportamiento siempre ocurre con matrices de transición regulares. Antes de 
poder presentar el teorema, es necesario el siguiente lema. 


Lema 4.32 


Sea P una matriz de transición regular de n X n. Si P es diagonalizable, entonces el ei- 
genvalor dominante A, = 1 tiene multiplicidad algebraica 1. 
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Demostración Los eigenvalores de P y P” son iguales. A partir de la demostración del 
Teorema 4.31(b), A, = 1 tiene multiplicidad geométrica 1 como un eigenvalor de P”. 
Puesto que P es diagonalizable, también lo es P”, por el ejercicio 41 de la sección 4.4. En 
consecuencia, el eigenvalor A, = 1 tiene multiplicidad algebraica 1, por el teorema de 
diagonalización. — A 


Teorema 4.33 


Vea Finite Markov Chains de J. G. 
Kemeny y J. L. Snell (Nueva York: 
Springer-Verlag, 1976). 


Se tomaron algunas libertades con 
la noción de límite. No obstante, 
dichos pasos deben ser intuitiva- 
mente claros. Las demostraciones 
rigurosas a partir de las propieda- 
des de los límites pueden encon- 
trarse en un curso de cálculo. En 
lugar de desviarse con una discu- 
sión de los límites de las matrices, 
se omitirán las demostraciones. 


Sea P una matriz de transición de n X n regular. Entonces, cuando k — oo, P* tiende 
a una matriz L de n X n cuyas columnas son idénticas, cada una igual al mismo vec- 
tor x. Este vector x es un vector de probabilidad de estado estacionario para P. 


Demostración Para simplificar la demostración, sólo se considerará el caso donde P es 
diagonalizable. Sin embargo, el teorema es verdadero sin esta suposición. 
Diagonalice P como Q”'PQ = D o, de manera equivalente, P = QDQ”*, donde 


di 0 0 
0 0 
D= . 
0.0 di 


A partir de los Teoremas 4.30 y 4.31, se sabe que cada eigenvalor A, es 1 o satisface |A/| 
< 1. Por tanto, conforme k —> oo, A tiende a 1 o 0 para i = 1,...,n. Se tiene que Dr 
tiende a una matriz diagonal, por decir, D*, donde cada una de sus entradas diagonales 
es 1 o 0. Por tanto, Pt = QD*Q™! tiende a L = QD*Q”?. Escriba 


ím P* = L 
k—o0 


Observe que 
PL = PlimP* = límP™ = límP*! = L 
k= k—=00 k—=>00 
Por tanto, cada columna de L es un eigenvector de P correspondiente a A; = 1. Para ver 
que cada una de dichas columnas es un vector de probabilidad (es decir, L es una matriz 
estocástica), sólo es necesario observar que, si j es el vector renglón con n números 1, en- 
tonces 


jL = jjim P = JimjP" = Jmj = j 


pues P* es una matriz estocástica, por el ejercicio 14 en la sección 3.7. El ejercicio 13 de 
la sección 3.7 implica ahora que L es estocástica. 

Sólo es necesario mostrar que las columnas de L son idénticas. La ¡-ésima columna 
de L es Le, donde e, es el ¡-ésimo vector base estándar. Sean v,, V», . . ., V, eigenvectores de 
P que forman una base de R”, con v, correspondiente a A, = 1. Escriba 


€; = CV] + Cw + *** + CWn 


ara escalares c loro...) Co Entonces, or el comentario en el recuadro después del ejem- 
192 n 
plo 4.21, 


ka — k k i k 
Pte; = C¡1v, + c,Aj vw), + EC AV 


Por el Lema 4.32, A, 4 1 para j # 1, de modo que, por el Teorema 4.31(b), |A¡| < 1 para 
17% 1. En consecuencia, A > 0 conforme k — œ, para j % 1. Se tiene que 


Le; = límP*e, = cv, 


k=>00 
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En otras palabras, la columna i de L es un eigenvector que corresponde a A, = 1. Pero se 
demostró que las columnas de L probablemente son vectores, de modo que Le,es el único 
múltiplo x de v, cuyos componentes suman 1. Dado que esto es cierto para cada co- 


lumna de L, implica que todas las columnas de L son idénticas, cada una igual a este vec- 
tor x. — 


Comentario Dado que L es una matriz estocástica, puede interpretarla como la matriz 
de transición de rango largo de la cadena de Markov. Esto es, L; representa la probabili- 
dad de estar en el estado i, habiendo partido del estado j, si las transiciones continuaran 
de manera infinita. El hecho de que las columnas de L sean idénticas dice que no importa 
el estado de partida, como lo ilustra el siguiente ejemplo. 


Ejemplo 4.38 


Recuerde la rata en la caja del ejemplo 3.65. La matriz de transición era 


t: T 

003 3 

aja 2 

P=13 0 3 
Lt .2 

3 3 0 


Se determinó que el vector de probabilidad de estado estacionario es 
0.250 0.250 0.250 


= [0.375 0.375 0.375 
0.375 0.375 0.375 


> 


Por tanto, las potencias de P tienden a 


E 
olw lw al 
olw lw el 
olw lw l= 


de donde se puede ver que la rata a la larga pasará 25% de su tiempo en el comparti- 
miento 1 y 37.5% de su tiempo en cada uno de los otros dos compartimientos. 


La discusión acerca de las cadenas de Markov concluye al demostrar que el vector de 
estado estacionario x es independiente del estado inicial. La demostración se adapta con 
facilidad para incluir el caso de los vectores de estado cuyos componentes suman una 
constante arbitraria, por ejemplo, s. En los ejercicios, se le pide demostrar algunas otras 
propiedades de las cadenas de Markov regulares. 


Teorema 4.34 


Sea P una matriz de transición de n X n regular, con x como el vector de probabili- 
dad de estado estacionario para P, como en el Teorema 4.33. Entonces, para cualquier 
vector de probabilidad inicial xņ, la sucesión de iteraciones de x, tiende a x. 


Demostración Sea 


X 


X2 
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donde x, + x, +: + x, = 1. Dado que x, = P*x,, debe demostrar que PES, =x. 


Ahora, por el Teorema 4.33, la matriz de transición de rango largo es L = [x x + x] 
y lim P* = L. Por tanto 
=> 


A SA 


Il 
A 
> 
H, 


= XX + xX t + xXx 
(x + x + o +x,)x=x 


Il 


Regrese al modelo de Leslie de crecimiento poblacional, que se exploró por primera vez 
en la sección 3.7. En el ejemplo 3.67 de dicha sección se vio que, para la matriz de Leslie 


0 4 3 
L=|05 0 0 
0 025 0 


las iteraciones de los vectores de población comienzan a aproximarse a un múltiplo del 
vector 
18 
6 
1 
En otras palabras, las tres clases etáreas de esta población finalmente terminarán en la 


razón 18: 6: 1. Más aún, una vez alcanzado este estado, es estacionario, pues las razones 
para los años siguientes están dadas por 


>< 
II 


0 4 3 || 18 27 
Ix=|05 0 0 6|=| 9 = 1.5x 
0 0.25 0 1 1.5 


y los componentes todavía están en la proporción 27:9:1.5 = 18:6:1. Observe que 1.5 
representa la tasa de crecimiento de esta población cuando alcanza su estado estacio- 
nario. 

Ahora puede reconocer que x es un eigenvector de L que corresponde al eigenvalor 
A = 1.5. Por tanto, la tasa de crecimiento de estado estacionario es un eigenvalor positivo 
de L, y un eigenvector que corresponde a este eigenvalor representa los tamaños relativos de 
las clases etáreas cuando se alcanza el estado estacionario. Puede calcular esto directamente 
sin tener que iterar como se hizo antes. 


Ejemplo 4.39 


= 
Encuentre la tasa de crecimiento de estado estacionario y las correspondientes razones 


entre las clases etáreas para la anterior matriz de Leslie L. 


Solución Necesita encontrar todos los eigenvalores positivos y sus correspondientes ei- 
genvectores de L. El polinomio característico de L es 


=A 4 3 
det(L — A) =| 0.5 —A 0| = —A +22 + 0.375 
0 0.25 —A 
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así que debe resolver —A? + 2A + 0.375 = 0 o, de manera equivalente, 8? — 161 — 3 = 0. 
Al factorizar, se tiene 


(22 — 3/4 +61+1)=0 


(Vea el Apéndice D.) Puesto que el segundo factor sólo tiene las raíces (3 + V5)/4 ~ 
0.19 y (-3 —V5)/4 = —1,31, la única raíz positiva de esta ecuación es A = 3=15 
Los correspondientes eigenvectores están en el espacio nulo de L — 1.51, que se encontró 
mediante reducción por renglón: 


= 4 3 J0 1.0 —18|0 
[L = 15510] =| 05 =L5 0 jo] —>|o 1 $0 
0 0.25 —1.5/0 0 0 0/0 
Xı 
Por tanto, six = | x, | es un eigenvector correspondiente a A = 1.5, satisface x, = 18x; y 
X3 
x, = 6x. Esto es, 
18x; 18 
Es = 6x; E is 6 
X3 1 


En consecuencia, la tasa de crecimiento de estado estacionario es 1.5 y, cuando se alcanza 
esta tasa, las clases etáreas están en la razón 18 : 6 : 1, como se vio antes. | 


En el ejemplo 4.39 sólo hubo un candidato para la tasa de crecimiento de estado es- 
tacionario: el eigenvalor positivo único de L. Pero, ¿qué hubiera hecho si L tuviera más 
de un eigenvalor positivo o ninguno? Aparentemente es muy afortunado que haya un ei- 
genvector correspondiente cuyos componentes son todos positivos, lo que permite rela- 
cionar dichos componentes con el tamaño de la población. Puede demostrar que esta si- 
tuación no es accidental; esto es, toda matriz de Leslie tiene exactamente un eigenvalor 
positivo y un correspondiente eigenvector con componentes positivos. 

Recuerde que la forma de una matriz de Leslie es 


by b by © by b 
s 0 0 +. 0 0 
0 0 0 
a n (3) 
0 0 5 0 
0.0.0 +. sga 0 


Dado que las entradas s; representan probabilidades de supervivencia, se supondrá que 
todas son distintas de cero (de otro modo, la población moriría rápidamente). También se 
supondrá que al menos uno de los parámetros de natalidad b, es distinto de cero (de otro 
modo no habría nacimientos y, nuevamente, la población moriría). Con estas suposiciones 
planteadas, ahora puede probar como teorema la aseveración hecha anteriormente. 


Teorema 4.35 


Toda matriz de Leslie tiene un eigenvalor positivo único y un eigenvector correspon- 
diente con componentes positivos. 


Oskar Perron (1880-1975) fue un 
matemático alemán que trabajó en 
muchos campos de las matemáti- 
cas, incluidos análisis, ecuaciones 
diferenciales, álgebra, geometría y 
teoría de números. El teorema de 
Perron se publicó en 1907 en un 
ensayo acerca de fracciones conti- 
nuas. 
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Demostración Sea L como en la ecuación (3). El polinomio característico de L es 


alà) = det(L — AD) 
(=D) = bh, = bys A? = bis ¡s A T — +. = b,515, *** Sy-1) 
(=D) 


(En el ejercicio 16 se le pide probar esto.) Por tanto, los eigenvalores de L son las raíces 
de f(A). Dado que al menos uno de los parámetros de natalidad b; es positivo y todas las 
probabilidades de supervivencia s; son positivas, los coeficientes de f(A) cambian de 
signo exactamente una vez. En consecuencia, por la regla de los signos de Descartes 
(Apéndice D), F(A) tiene exactamente una raíz positiva. Llámela A. 

Mediante cálculo directo, puede comprobar que un eigenvector que corresponde a 
A, es 


1 


s/M 
5152 /M 
515253 /A; 


n-1 
$15253 eesi AT 


(En el ejercicio 18 se le pide demostrar esto.) Claramente, todos los componentes de x; 
son positivos. — 


De hecho, hay algo más de verdad. Con el requisito adicional de que dos parámetros 
de natalidad consecutivos b, y b,, sean positivos, se evidencia que el único eigenvalor po- 
sitivo A, de L es dominante; esto es, cualquier otro eigenvalor A (real o complejo) de L sa- 
tisface [A] < A,. (Está más allá del ámbito de este libro demostrar este resultado, pero 
en el ejercicio 27 se bosqueja una demostración parcial para los lectores familiarizados 
con el álgebra de números complejos.) Esto explica por qué se consigue convergencia en 
un vector de estado estacionario cuando se iteran los vectores de población: ¡es justo el 
método de potencia que trabaja para usted! 


El Teorema de Perron-Frobenius 


En las dos aplicaciones anteriores, cadenas de Markov y matrices de Leslie, se vio que el 
eigenvalor de interés era positivo y dominante. Más aún, hubo un correspondiente ei- 
genvector con componentes positivos. Se evidencia que un teorema notable garantiza 
que este será el caso para una gran clase de matrices, incluidas muchas de las que se han 
considerado. La primera versión de este teorema es para matrices positivas. 

Primero, es necesaria cierta terminología y notación. Recuerde referirse a un vector 
como positivo si todos sus componentes son positivos. Para dos matrices de A = 
[a;] m X n y B= [b;], se escribirá A = B si a; = b; para todo 1 y j. (Definiciones simila- 
res se aplicarán para A > B, A <= B, etcétera.) Por tanto, un vector positivo x satisface 
x > 0. Defina |A| = [a;l] como la matriz de los valores absolutos de las entradas de A. 
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Teorema 4.36 


Teorema de Perron 


Sea A una matriz positiva de n X n. Entonces A tiene un eigenvalor real A, con las si- 
guientes propiedades: 


as M0 
b. A, tiene un eigenvector positivo correspondiente. 
c. Si A es cualquier otro eigenvalor de A, entonces |A| 5 À. 


Intuitivamente, puede ver por qué deben ser verdaderos los dos primeros enunciados. 
Considere el caso de una matriz positiva A de 2 X 2. La correspondiente transformación 
matricial mapea el primer cuadrante del plano adecuadamente en sí mismo, pues todos 
los componentes son positivos. Si repetidamente se permite a A actuar sobre las imáge- 
nes que se tienen, necesariamente convergen hacia algún rayo en el primer cuadrante (fi- 
gura 4.18). Un vector director para este rayo será un vector positivo x, que debe ma- 
pearse en algún múltiplo positivo de sí mismo (por decir, A,), pues A deja el rayo fijo. En 
otras palabras, Ax = Àx, con x y A, ambos positivos. 


Demostración Para algunos vectores distintos de cero x, Ax = Ax para algún escalar A. 
Cuando esto sucede, entonces A(kx) = A(kx) para toda k > 0; por tanto, sólo es necesa- 
rio considerar vectores unitarios x. En el capítulo 7 se verá que A mapea al conjunto de 
todos los vectores unitarios en R” (la esfera unitaria) en un “elipsoide generalizado”. De 
este modo, conforme x varía sobre los vectores no negativos en esta esfera unitaria, habrá 
un valor máximo de A tal que Ax = Ax. (Vea la figura 4.19.) Denote este número me- 
diante A, y el correspondiente vector unitario mediante x}. 


y y y y 
A A A A 
Xx 
>x >x >x >x 
Figura 4.18 
Y 
A 
AX 


Ax AX¡ = ÀX] 
"i >X 


Figura 4.19 
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Ahora se demostrará que Ax, = A,x;. Si no, entonces Ax, > A,X,, y al aplicar A nue- 
vamente, se obtiene 


A(Ax,) > A(A1x,) = (Axı) 


donde la desigualdad se conserva, pues A es positiva. (Vea el ejercicio 40 y la sección 3.7, 
ejercicio 36.) Pero entonces y = (1/[] Ax, ||) Ax; es un vector unitario que satisface Ay > 
A, y, de modo que habrá algún A, > A, tal que Ay = Ay. Esto contradice el hecho de que 
A, era el valor máximo con esta propiedad. En consecuencia, debe ser el caso que Ax, = 
A,x,; esto es: A, es un eigenvalor de A. 

Ahora A es positivo y x, es positivo, de modo que A,x, = Ax, > 0. Esto significa que 
A, > 0 yx, > 0, lo que completa la demostración de (a) y (b). 

Para demostrar (c), suponga que A es cualquier otro eigenvalor (real o complejo) de 
A con correspondiente eigenvector z. Entonces Az = Az y, al tomar valores absolutos, se 
tiene 


Alz| = |A]|z| = |Az| = [Az] = |A]]2] (4) 


donde la desigualdad intermedia surge de la Desigualdad del Triángulo. (Vea el ejercicio 
40.) Dado que |z| > 0, el vector unitario u en la dirección de |z| también es positivo y sa- 


tisface Au = |Aļu. Por ser máxima de A, desde la primera parte de esta demostración, se 
debe tener |A| 5 À. — 


De hecho, hay algo más de verdad. Se evidencia que A, es dominante, de modo que 
[A| < A, para cualquier eigenvalor A # A,. También es el caso que A, tiene multiplicidad 
algebraica y por tanto geométrica de 1. No se demostrarán estos hechos. 

El teorema de Perron puede generalizarse a partir de matrices positivas a ciertas ma- 
trices no negativas. Frobenius lo hizo en 1912. El resultado requiere una condición téc- 
nica en la matriz. Una matriz cuadrada A se llama reducible si, sujeta a alguna permuta- 
ción de los renglones y la misma permutación de las columnas, A puede escribirse en 
forma de bloque como 

o» 
O D 


donde B y D son cuadradas. De manera equivalente, A es reducible si hay alguna matriz 
permutación P tal que 


“ln 
PAP = 
O D 
(Vea la página 193.) Por ejemplo, la matriz 

200 1-3 
4 2 1 5 5 
A=|1 27 3 0 
6 0 0 2 1 
10.07 2 


es reducible, pues el intercambio de los renglones 1 y 3 y luego las columnas 1 y 3 pro- 
duce 
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(Esto es justo PAP", donde 


00.100 
01000 
P=|1 0 0 0 0 
00.010 
0 0 0 0 1I 


¡Compruebe esto!) 

Una matriz cuadrada A que no es reducible se llama irreductible. Si A* > O para al- 
guna k, entonces A se llama primitiva. Por ejemplo, toda cadena de Markov regular tiene 
una matriz de transición primitiva, por definición. No es difícil demostrar que toda ma- 
triz primitiva es irreductible. (¿Puede ver por qué? Trate de demostrar la contrapuesta de 
esto.) 


Teorema 4.37 


Vea Matrix Analysis de R. A. Horn 
y C. R. Johnson (Cambridge, In- 
glaterra: Cambridge University 
Press, 1985). 


El teorema de Perron-Frobenius 


Sea A una matriz de n X n no negativa irreductible. Entonces A tiene un eigenvalor 
real A, con las siguientes propiedades: 


a. A¡>0 

b. A,tiene un correspondiente eigenvector positivo. 

c. Si A es cualquier otro eigenvalor de A, entonces |A| S A,. Si A es primitiva, en- 
tonces esta desigualdad es estricta. 

d. Si A es un eigenvalor de A tal que [A] = A,, entonces A es una raíz (compleja) de la 
ecuación A" — Af = 0. 

e. A,tiene multiplicidad algebraica de 1. 


El lector interesado puede encontrar una prueba del teorema de Perron-Frobenius en 
muchos textos acerca de matrices no negativas o análisis de matrices. El eigenvalor A, 
con frecuencia se conoce como raíz de Perron de A, y un correspondiente vector de pro- 
babilidad (que necesariamente es único) se llama eigenvector de Perron de A. 


Los números de Fibonacci son los que forman la sucesión 0, 1, 1,2, 3, 5, 8, 13, 21,..., 
donde, después de los primeros dos términos, cada nuevo término se obtiene al sumar 
los dos términos que lo anteceden. Si el n-ésimo número de Fibonacci se denota f;, en- 
tonces esta sucesión se define completamente mediante las ecuaciones fọ = 0, fi = 1 y, 
para n= 2, 


fa = fasi F fa-2 


Esta última ecuación es un ejemplo de una relación de recurrencia lineal. Se regresará a 
los números de Fibonacci, pero primero se considerarán las relaciones de recurrencia li- 
neal de manera un poco más general. 
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Leonardo de Pisa (1170-1250), es mejor conocido por su sobrenombre, Fibonacci, que significa 
“hijo de Bonaccio”. Escribió algunos libros importantes, muchos de los cuales han sobrevivido, 
incluido Liber abaci y Liber quadratorum. La sucesión de Fibonacci aparece como la solución a 
un problema en Liber abaci: “Cierto hombre puso un par de conejos en un lugar rodeado en 
todos lados por una pared. ¿Cuántos pares de conejos pueden producirse en un año a partir de 
este par, si supone que cada mes cada pareja engendra un nuevo par que a partir del segundo 
mes se vuelve productivo?” El matemático francés Edouard Lucas (1842-1891) dio el nombre nú- 
meros de Fibonacci a los términos de esta sucesión. 


Definición Sea (x,) = (x, xp xX» . . .) una sucesión de números que se define del 
modo siguiente: 


1. xp = Ap Xi = Ap»... Xp-1 = a p donde ap 41)... > 4, SON escalares; 
2. Para todo n=kx,= GX, + OX A dond CNC AS O 
escalares. 


Si c,% 0, la ecuación en (2) se llama relación de recurrencia lineal de orden k. Las 
ecuaciones en (1) se conocen como condiciones iniciales de la recurrencia. 


Por tanto, los números de Fibonacci satisfacen una relación de recurrencia lineal de 
orden 2. 


Comentarios 

+ Si, con la finalidad de definir el n-ésimo término en una relación de recurrencia, 
se requiere el (n — k)-ésimo término pero ningún término antes que él, entonces la 
relación tiene orden k. 

+ El número de condiciones iniciales es el orden de la relación de recurrencia. 

+ No es necesario que el primer término de la sucesión se llame x,. Podría comen- 
zar en X; o en cualquier otro. 

+ Es posible tener incluso relaciones de recurrencia lineal más generales al permi- 
tir que los coeficientes c, sean funciones en lugar de escalares al permitir un coeficiente 
adicional aislado, que también puede ser una función. Un ejemplo sería la recurrencia 


1 
2 2 
Xa = 2X N kaa F qn- +n 


Aquí no se considerarán tales recurrencias. 


Ejemplo 4.40 


> 
Considere la sucesión (x,) definida por las condiciones iniciales x, = 1, x, = 5 y la rela- 
ción de recurrencia x, = 5x,, — 6x,_, para n = 2. Escriba los primeros cinco términos 
de esta sucesión. 


n 


Solución Se proporcionan los dos primeros términos. La relación de recurrencia se usa 
para calcular los siguientes tres términos. Se tiene 


X= 5% = 61 =5:5-—6:1=19 
x, = 5x3 — 6x% = 5-19 — 6-5 = 65 
xX; = 5x, — 6x% = 565 — 6-19 = 211 


de modo que la sucesión comienza 1, 5, 19, 65, 211,.... f 
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Claramente, si se está interesado en, por ejemplo, el 100-ésimo término de la suce- 
sión en el ejemplo 4.40, entonces el enfoque usado sería más bien tedioso, pues tendría 
que aplicar la relación de recurrencia 98 veces. Sería agradable si pudiera encontrar una 
fórmula explícita para x, en función de n. Al hecho de encontrar tal término se le llamará 
resolver la relación de recurrencia. El proceso se ilustrará con la sucesión del ejemplo 
4.40. 

Para comenzar, reescriba la relación de recurrencia como una ecuación matricial. Sea 


el 


; x, x 5 
e introduzca los vectores x, = | f | para n = 2. Por tanto, x, = | | = | l 
Xn Xi 


X 19 x 65 
x= | l = X% = | | = | l etcétera. Ahora observe que, para n = 2, se tiene 
X 5 X3 19 


5 —6 Xn-1 SXp-1 => 6Xp-2 Xn 
AX,- = = = = X, 
1 0 Xn-2 Xnm-1 Xp-1 
Note que este es el mismo tipo de ecuación que se encontró con las cadenas de Markov 
y las matrices de Leslie. Como en dichos casos, puede escribir 


Xx, = Ax — A’X,2 =... = A= 


n—l1 


Ahora use la técnica del ejemplo 4.29 para calcular las potencias de A. 
La ecuación característica de A es 


N=51+6=0 


de la cual se encuentra que los eigenvalores son A, = 3 y A, = 2. (Note que la forma de 
la ecuación característica sigue la de la relación de recurrencia. Si escribe la recurrencia 
como x, — 5x,,_, + 6x,_, = 0, ¡es evidente que los coeficientes son exactamente iguales!) 
Los correspondientes eigenespacios son 


ssl) y el 


2 3 
Al hacer P = |s sabe que PAP = D = h ol Entonces A = PDP”! y 


cl 
DR slo 1E E 


[3t = 2k+1 —2(3*+!) + Aj 
3k — 2* —2(3®) + 3(25) 


Ahora se tiene que 


X, s gral uN 2”! ASS) + qa” 5 an pan gr 
=x% 5A" X = =2 =2 -2 -2 = =i ei 
x 3"=2 — 2"? 232) +3(272) J| 1 gral — 2" 
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de la cual se lee las solución x, = 3" — 2”. (Para comprobar el trabajo, podría sustituir 
n =1,2,...,5 para verificar que esta fórmula produce los mismos términos que se 
calcularon usando la relación de recurrencia. ¡Inténtelo!) 

Observe que x, es una combinación lineal de potencias de los eigenvalores. Éste es 
necesariamente el caso en tanto los eigenvalores sean distintos [como lo hará explícito el 
Teorema 4.38(a)]. Con esta observación puede ahorrarse algo de trabajo. Una vez que 
calcule los eigenvalores A, = 3 y A, = 2, inmediatamente puede escribir 


n= 03 + 02” 


donde deben determinarse c; y C,. Con las condiciones iniciales se tiene 


a3! + (2! = 3, + 20 


1 =x 
cuando n = 1 y 
5 =% = q3 + c,2? = 9c + 4o 


cuando n = 2. Ahora resuelva el sistema 


3c, + 2c, = 1 
9%, +4c0)=5 
para C, y C, para obtener c, = 1 y c, = —1. Por tanto, x, = 3” — 2”, como antes. 


Éste es el método que se usará en la práctica. Ahora se ilustrará su uso para encontrar 
una fórmula explícita para los números de Fibonacci. 


Ejemplo 4.41 


Jacques Binet (1786-1856) hizo 
aportaciones a la teoría de matri- 
ces, la teoría de números, física y 
astronomía. Descubrió la regla 
para la multiplicación de matrices 
en 1812. La fórmula de Binet para 
los números de Fibonacci en reali- 
dad se debe a Euler, quien la pu- 
blicó en 1765; sin embargo, quedó 
en el olvido hasta que Binet pu- 
blicó su versión en 1843. Como 
Cauchy, Binet fue realista y perdió 
su posición en la universidad 
cuando Carlos X abdicó en 1830. 
Recibió muchos honores por su 
trabajo, incluida su elección, en 
1843, a la Académie des Sciences. 


Resuelva la recurrencia de Fibonacci f, = 0, fi = 1 y f, = f,-1 + fı- para n = 2. 


Solución Al escribir la recurrencia como f, — f,,_, — fa- = 0, se ve que la ecuación ca- 
racterística es A? — À — 1 = 0, de modo que los eigenvalores son 


1+ v5 1- v5 
= — à, = — — 


A 
i 2 X 2 


De la discusión anterior se tiene que la solución a la relación de recurrencia tiene la 
forma 
E 1- v5\ 


para algunos escalares C, y C,. 
Al usar las condiciones iniciales se encuentra 


0O=f=cA +04 =a Fo 


1+ v5 i= y5 
y 1=f = qÀ + o = (5) + (28) 
2 2 
Al resolver para C, y C,, se obtiene c, = 1/ V5 y c, = —1/ V5. Por tanto, una fórmula ex- 
plícita para el n-ésimo número de Fibonacci es 


AN 8) (5) 
LEA a La 


a 
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La fórmula (5) es una fórmula notable, porque se define en términos del número 
irracional V5, ¡aunque los números de Fibonacci son todos enteros! Trate de sustituir al- 
gunos valores para n para ver cómo se cancelan los términos V5 para dejar los valores 
enteros f,. La fórmula (5) se conoce como fórmula de Binet. 

El método que acaba de bosquejarse funciona para cualquier relación de recurrencia 
lineal de segundo orden cuyos eigenvalores asociados sean todos distintos. Cuando haya 
un eigenvalor repetido, la técnica deberá modificarse, pues el método de diagonalización 
empleado puede ya no funcionar. El siguiente teorema resume ambas situaciones. 


Teorema 4.38 


Sea x, = ax, _, + bx, _, una relación de recurrencia que se define mediante una suce- 
sión (x,). Sean A, y A, los eigenvalores de la ecuación característica asociada A* — 
ak—=b=0. 


a. Sil, Æ A, entonces x, = CJA] + cA para algunos escalares C, y C,. 
b. Si à = A, = A, entonces x, = c,A” + c,nA” para algunos escalares C, y C,. 


En cualquier caso, C, y C, pueden determinarse usando las condiciones iniciales. 


Demostración (a) Al generalizar la discusión anterior, puede escribir la recurrencia 
como x, = Ax,_ ,, donde 


aa 
if Xizi ) 1 0 


Dado que A tiene eigenvalores distintos, puede diagonalizarse. El resto de los detalles se 
dejan para el ejercicio 53. 


(b) Se demostrará que x, = c,A” + c nà” satisface la relación de recurrencia x, = 
ax, 1 + bx,_, 0, de manera equivalente, 


Xn AXn—1 bx-> =0 (6) 


si A? — ad — b = 0. Dado que 
gaal Gia = DA y gmn aA on = 


la sustitución en la ecuación (6) produce 


aX,- dx, = (GA" + cn) — a(g Aà! + ofn — 1)A"!) 
= b(a A"? + a(n — 2)A"?) 
= (A? — aX"! — bA"?) + ena" — a(n — 1)A"! 
= b(n — 2)A"?) 
CATAN — aà — b) + on™? (X — aà — b) + oA’ (aà + 2b) 
CA ™?(0) + onA"™?(0) + ca + 2b) 
GA”? (aà + 2b) 


x 


n 


Pero, puesto que À es una raíz doble de A? — ad — b = 0, se debe tener a? + 4b = 0 y 
à = a/2, usando la fórmula cuadrática. En consecuencia, aà + 2b = a?/2 + 2b = —4b/2 
+ 2b = 0, de modo que 


x bx, = GÀ"? (aà + 2b) = aA"? (0) = 0 


n 


ax, 


m=1 
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Suponga que las condiciones iniciales son x, = r y x, = s. Entonces, en (a) o en (b) 
hay una solución única para c; y C,. (Vea el ejercicio 54.) | 


Ejemplo 4.42 Resuelva la relación de recurrencia x, = 1,x, = 6 yx, = 6x,_, — 9x,_, paran = 2. 


Solución La ecuación característica es A? — 64 + 9 = 0, que tiene A = 3 como raíz 
doble. Por el Teorema 4.38(b), debe tener x, = c,3" + c,n3" = (c + c,n)3". Dado que 1 = 
Xy = & y6 = x = (c, + c,)3, se encuentra que c, = 1, de modo que 


x, = (1 + n)3” BE 


Las técnicas que se destacan en el Teorema 4.38 pueden extenderse a relaciones de recu- 
rrencia de orden superior. Se enuncia, sin demostración, el resultado general. 


Teorema 4.39 —Seax,=a, ,x, + apx, 
que se satisface mediante una sucesión (x,,). Suponga que el polinomio característico 
asociado 


+ +++ a7X,-, una relación de recurrencia de orden m 


nom 


mo men Eaa a —Ñ 
A OEA EN dy 


se factoriza como (À — AD A — AN E (A A donde 
m. Entonces x, tiene la forma 


Xy = (01M + Ciani E cn A a N 


CPE A E GAN e E F Ga A) 


Sistemas de ecuaciones diferenciales lineales 


En cálculo se aprende que si x = x(t) es una función derivable que satisface una ecua- 
ción diferencial de la forma x’ = kx, donde k es una constante, entonces la solución ge- 
neral es x = Ce™, donde C es una constante. Si se especifica una condición inicial x(0) = 
X¿ entonces, al sustituir t = 0 en la solución general, se encuentra que C = x,. En conse- 
cuencia, la solución única a la ecuación diferencial que satisface la condición inicial es 


x = xe" 


Suponga que tiene n funciones derivables de t, por decir, x,, X» . . ., X,» que satisfacen 
un sistema de ecuaciones diferenciales 
! = ... 
Xi = AX E AX 5 *** E AX 


X= Aak + 079%), T AE Aa 


i 
n 


Xy = AX] F Ap% + E ApnXn 


Puede escribir este sistema en forma matricial como x' = Ax, donde 


x(t) x(t) A Anz ` An 
x(t x(t a a 

x(t) = A ) y x(t) = A ) , y A= 21 2 An 
x,( t) x(t) An an i Ann 


Ahora puede usar métodos matriciales para encontrar la solución. 
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Primero, una observación útil. Suponga que quiere resolver el siguiente sistema de 
ecuaciones diferenciales: 
xi = 2x 
x= 5x, 
Cada ecuación puede resolverse por separado, como anteriormente, para dar como re- 


sultado 
z= Ge” 


D= Ge” 


donde C, y C, con constantes. Note que, en forma matricial, la ecuación x' = Ax tiene 
una matriz de coeficientes diagonal 
2 0 
A= 
0.5 


y los eigenvalores 2 y 5 ocurren en los exponenciales e” y e* de la solución. Esto sugiere 
que, para un sistema arbitrario, debe comenzar por diagonalizar la matriz de coeficien- 
tes si es posible. 


Ejemplo 4.43 


Resuelva el siguiente sistema de ecuaciones diferenciales: 
x= xi + 2x% 
x = 3x, + 2x, 

1 2 


3 a y se encuentra que los eigen- 


Solución Aquí la matriz de coeficientes es A = | 
; f 2 
valores son A, = 4 y A, = —1, con sus correspondientes eigenvectores v, = a |Y 


vV = i i respectivamente. Por tanto, A es diagonalizable y la matriz P que hace el 


trabajo es 


Se sabe que 


5 h i 
P AP = =D 
0 =] 


Sea x = Py (de modo que x' = Py’) y sustituya estos resultados en la ecuación original 
x’ = Ax para obtener Py’ = APy o, de manera equivalente, 


y' = PAPy = Dy 
Este es justo el sistema 


n= Y 


cuya solución general es 
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Para encontrar x, sólo calcule 


r h | a p E i 
X == —. po 
y 3 1]|LC,e* 3C¡ + Ce" 


de modo que x, = 2C,e* — Ce yx, = 3C,e* + C,e *. (Compruebe que estos valores 


satisfacen el sistema dado.) 


Comentario Observe que la solución del ejemplo 4.43 también podría expresarse 
como 


2 1 
x= Get] + ea | = Civ, + Gev, 


Esta técnica se generaliza fácilmente a sistemas de n X n donde la matriz de coefi- 
cientes es diagonalizable. El siguiente teorema, cuya demostración se deja como ejerci- 
cio, resume la situación. 


Teorema 4.40 


Sea A una matriz diagonalizable de n X n y sea P= [v, v, ~- v,]tal que 
A a a 0 
piar- 
oroni 


Entonces la solución general al sistema x’ = Ax es 


x = Cev, + Gev, ++ + C e™v, 


Fl siguiente ejemplo involucra un modelo biológico en el que dos especies viven en 
el mismo ecosistema. Es razonable suponer que la tasa de crecimiento de cada especie 
depende de los tamaños de ambas poblaciones. (Desde luego, existen otros factores que 
gobiernan el crecimiento, pero el modelo se mantendrá simple al ignorarlos.) 

Si x(t) y x, (t) denotan los tamaños de las dos poblaciones en el tiempo t, entonces 
x(t) y x(t) son sus tasas de crecimiento en el tiempo t. El modelo es de la forma 


xi(t) = axy(t) + bxx(t) 
x(t) = cx(t) + dx,t) 


donde los coeficientes a, b, c y d dependen de las condiciones. 


> 


Ejemplo 4.44 


Mapaches y ardillas habitan el mismo ecosistema y compiten mutuamente por alimento, 
agua y espacio. Sean r (t) y s(t) las poblaciones de mapaches y ardillas en el tiempo t años, 
respectivamente. En ausencia de ardillas, la tasa de crecimiento de mapaches es r(t) = 
2.5r (t), pero cuando están presentes las ardillas, la competencia frena la tasa de creci- 
miento de los mapaches a r'(t) = 2.5r(t) — s(t). La población de ardillas es similarmente 
afectada por los mapaches. En ausencia de mapaches, la tasa de crecimiento de la pobla- 
ción de ardillas es st) = 2.5s(t) y la tasa de crecimiento poblacional para las ardillas 
cuando comparten el ecosistema con los mapaches es s(t) = —0.25r(t) + 2.5s(t). Su- 
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ponga que inicialmente hay 60 mapaches y 60 ardillas en el ecosistema. Determine lo que 
ocurre con estas dos poblaciones. 


Solución El sistema es x’ = Ax, donde 


x= x9) = [10] y a=] 2.5 i 


s(t) =025 25 
Los eigenvalores de A son A, = 3 y A, = 2, con sus correspondientes eigenvectores v, = 


=2 2 
| e] yv = | 1 Por el Teorema 4.40, la solución general del sistema es 


—2 2 
x(t) = Gev + Gen = Gel l + H (7) 


60 
El vector de población inicial es x(0) = | | = | so , de modo que, al hacer t = 0 


s(0) 


a[i eil- Lal 


Al resolver esta ecuación, se encuentra C, = 15 y C, = 45. Por tanto, 


en la ecuación (7), se tiene 


x(t) = 15012 + 4501? 


de donde se encuentra r(t) = —30e* + 90e* y s(t) = 15e” + 45e”. La figura 4.20 mues- 
tra las gráficas de estas dos funciones, y puede ver claramente que la población de ma- 
paches muere después de poco más de un año. (¿Puede determinar exactamente cuándo 


muere?) | 


Ahora considere un ejemplo similar, en el que una especie es una fuente de alimento 
para la otra. Tal modelo se llama modelo depredador-presa. Una vez más, el modelo se 
simplificará drásticamente con la finalidad de ilustrar sus principales características. 


0.2 04 06 08 1 


Figura 4.20 
Poblaciones de mapaches y ardillas 
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> 


Ejemplo 4.45 


Petirrojos y gusanos cohabitan en un ecosistema. Los petirrojos comen gusanos, que son 
su única fuente de alimento. Las poblaciones de petirrojos y gusanos en el tiempo taños 
se denotan mediante r(t) y w(t), respectivamente, y las ecuaciones que gobiernan el cre- 


cimiento de las dos poblaciones son 

r(t) = w(t) — 12 
Pora (8) 
w'(t) = =r(£) + 10 


Si inicialmente 6 petirrojos y 20 gusanos ocupan el ecosistema, determine el comporta- 
miento de las dos poblaciones con el tiempo. 


Solución Lo primero que se nota acerca de este ejemplo es la presencia de las constan- 
tes adicionales, — 12 y 10, en las dos ecuaciones. Por fortuna, puede deshacerse de ellas 
con un simple cambio de variables. Si hace r(t) = x(t) + 10 y w(t) = y(t) + 12, enton- 
ces r'(t) = xt) and w(t) = y'(t). Al sustituir en las ecuaciones (8), se tiene 


x(t) = y(t) 


y = xi) A 


con las que es más fácil trabajar. Las ecuaciones (9) tienen la forma x’ = Ax, donde A = 


1 
| j Al Las nuevas condiciones iniciales son 
x(0) =r(0) -10=6-10=-4 y  y(0)=w(0) -12=20-12=8 


de modo que x(0) = a 


Al proceder como en el último ejemplo, se encuentran los eigenvalores y eigenvec- 
tores de A. El polinomio característico es A? + 1, que no tiene raíces reales. ¿Qué debe 
hacer? No se tiene otra opción que usar las raíces complejas, que son A, =1y A, = 


; i i is : 1 
—i. Los correspondientes eigenvectores también son complejos, a saber, v, = | A Y 
i 


1 
v = | l Por el Teorema 4.40, la solución tiene la forma 
—i 


: . |1 al 
x(t) = Cje"v, + Cie "v, = ce l + ca] l 
1 —1 


4 
A partir de x(0) = | al se tiene 


a+) Es 


cuya solución es C, = —2 — 4i y C, = —2 + 4i. De modo que la solución al sistema (9) 
es 


OA sel ba w|] 


1 


¿Qué se hará con esta solución? Petirrojos y gusanos habitan un mundo real, jaunque 
la solución involucra números complejos! Proceda intrépidamente y aplique la fórmula de 
Euler 


e" = cost + isen t 
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esa AL QUE ÑO OOH. ESTO ES COMPLICADO. | | ¿números VÓ : ¿CÓMO INSTINTO. LOS 
QUI TIENES QUE USAR CÁLCULO || ÍmaAGinA- JONCEDIEZ, APRENDISTE | TIGRES NACE- 
PUEDO RESOLVER. ¿CUANTO TREINTA-DOCE TÚ TODO MOS CON ÉL. 


Y NÚMEROS IMAGINARIOS. 
EA $ 9 + 4? RIOS? A y Topos esos. | ESO? ¡NI SI- 
È H - ES UN POCO || QUIERA 
4 y= ; t CONFUSO AL | | FUISTE A LA 
M : ' PRINCIPIO. 


la 


< \ 
g à 


CALVIN Y HOBBES © 1988 Watterson. Reimpreso con permiso de UNIVERSAL PRESS SYNDICATE. Todos los derechos 
reservados. 


(Apéndice C) para obtener e" = cos(—t) + i sen(—t) = cos t — i sen t. Al sustituir se 
tiene 


x(t) = (=2 — di)(cost + ¿sen JH TEE — ¿sen a, 


E Foa + 4sen t) + i(—4 cos t — 2 sen J 
(4cost + 2sen t) + i(—2 cost + 4 sen t) 


[rara + 4 sen t) + ¡(4cost + 2 sen dl 
(4cost + 2 sent) + ¡(2 cost — 4 sen t) 


E [a 8 sen l 
8 cost + 4sen t 


Esto produce x(t) = —4 cos t + 8 sen t y y(t) = 8 cos t + 4 sen t. Al poner todo en tér- 
minos de las variables originales, se concluye que 


r(t) = x(t) + 10 = —4 cost + 8 sen t + 10 
w(t) = y(t) + 12 = 8 cost + 4sen t + 12 


T | T | T | T T T T f | | | | >í 
O 2 4 6 8 10 12 14 16 
Figura 4.21 Figura 4.22 
Poblaciones de petirrojos y gusanos 
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¡De modo que la solución es real después de todo! Las gráficas de r(t) y w(t) en la figura 
4.21 muestran que las dos poblaciones oscilan periódicamente. Conforme aumenta la 
población de petirrojos, la población de gusanos comienza a disminuir, pero como dis- 
minuye la única fuente de alimento de los petirrojos, su número también comienza a de- 
clinar. A medida que los depredadores desaparecen, la población de gusanos comienza a 
recuperarse. Conforme aumenta su suministro de alimento, también lo hace la pobla- 
ción de petirrojos y el ciclo se repite. Esta oscilación es típica de los ejemplos en los que 
los eigenvalores son complejos. 

Graficar petirrojos, gusanos y tiempo en ejes separados, como en la figura 4.22, cla- 
ramente revela la naturaleza cíclica de las dos poblaciones. a 


Esta sección concluye al observar lo que se hizo desde un punto de vista diferente. Si 
x = x(t) es una función derivable de t, entonces la solución general de la ecuación dife- 
rencial ordinaria x' = ax es x = ce”, donde c es un escalar. Los sistemas de ecuaciones di- 
ferenciales lineales consideradas tienen la forma x’ = Ax, de modo que, si simplemente 
trabaja sin pensar, podría sentirse tentado a deducir que la solución sería x = ce“, donde 
c es un vector. ¿Pero qué significa esto? En el lado derecho se tiene el número e elevado a 
la potencia de una matriz. Esto parece no tener sentido, pero verá que hay una forma de 
darle sentido. 

Comience por considerar la expresión eĉ. En cálculo, aprende que la función e tiene 
una expansión en serie de potencias 


2 x 


x 
ë=1+x+>+>+ 
21 3! 


que converge para todo número real x. Por analogía, defina 


Aa A? 
AEA S e 
2! 3! 


El lado derecho se define en términos de potencias de A, y puede demostrarse que con- 
verge para cualquier matriz real A. De modo que ahora e^ es una matriz, llamada expo- 
nencial de A. ¿Pero cómo puede calcularse e^ o e“? Para matrices diagonales es sencillo. 


Ejemplo 4.46 


4 0 
Calcule e” para D = le l 


Solución A partir de la definición se tiene 
(De)? (Dr) 


e”=I+Dt+ 7 U T 
A AS 
_ [1 + (4t) + a(41)? + (4t +e 0 | 
0 e 
a ES ll 
| + 


La exponencial de la matriz también es amigable si A es diagonalizable. 
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Ejemplo 4.47 


1 2 
Calcule e* para A = | | 
3 2 


Solución En el ejemplo 4.43 se encontró que los eigenvalores de A son A, = 4 y A, = 


f í 2 -= : 
—1, con correspondientes eigenvectores v, = 2] yv = | al respectivamente. Por 


2 =] 4 0 
tanto, con P=[w, v,] = E a se tiene P'AP = D = la l Dado que 


A = PDP”., se tiene A* = PD*P™!, de modo que 


2 3 


IFA +H 
21.031 


a 
II 


“i =i 1 2p-1 1 3p-1 
PIP’ + PDP + POP PD +... 
D D? 
oro E o 
2! 3! 
= PePp”! 
a ife a e 
3 10 e*]L3 1 
B Laet 3e! 2e -— a 
5| 3e — 3e! 3e* + 2e! 


e 


¡Ahora está en posición de demostrar que la audaz (y aparentemente absurda) supo- 
sición de una solución “exponencial” de x’ = Ax no era tan disparatada del todo! 


Teorema 4.41 


Sea A una matriz diagonalizable de n X n con eigenvalores A,,A,,..., A,. Entonces la 
solución general al sistema x’ = Ax es x = e*c, donde c es un vector constante arbi- 
trario. Si se especifica una condición inicial x(0), entonces c = x(0). 


Demostración Sea P que diagonaliza A. Entonces A = PDP”* y, como en el ejemplo 4.47, 
e“ ee Pe”! p~! 


En consecuencia, es necesario comprobar que x’ = Ax se satisface por x = Pe”P™'c. 
Ahora todo es constante, excepto por e”, de modo que 


dx d d 
¡iia MAA P Dtp-1 = p= Dt pr! 10 
e dt di e e) a es yo 
à 0 œ 0 
Si D=|. E A : 


0.0 -- A, 


Por ejemplo, vea Linear Algebra de 
S. H. Friedberg, A. J. Insel y L. E. 
Spence (Englewood Cliffs, NJ: 
Prentice-Hall, 1979). 
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et o 0 
Mt 
entonces e” = $ il H 
0 0 e 
Al efectuar derivadas se tiene 
d Àt 
piae 1 0 0 
gE D 
d 
0 — (e^! 0 
Ao = a ) 
dt 3 n 
d 
0 0 — (e^! 
ge) 
Mer 0 0 
a E 0 
0 0 A, ek 
À 0 o Ter 0 0 
=D A 0 0 ¿e 0 
0 0 Àn 0 0 em! 
= De? 


Al sustituir este resultado en la ecuación (10) se obtiene 
x' = PDeP'P"!e = PDP"*PePp" lc = (PDP~')(Pe™P~')c = Ae™c = Ax 


como se requería. 
La última expresión se obtiene fácilmente del hecho de que si x = x(t) = e“c, en- 
tonces 


pues e? = I. (¿Por qué?) _ a 


De hecho, el Teorema 4.41 es verdadero incluso si A no es diagonalizable, pero no se de- 
mostrará esto. El cálculo de exponenciales de matrices para matrices no diagonalizables 
requiere la forma normal de Jordan de una matriz, un tema que puede encontrarse en 
textos más avanzados de álgebra lineal. 

De manera ideal, este breve paréntesis sirvió para ilustrar el poder de las matemáti- 
cas para generalizar y el valor del pensamiento creativo. Las exponenciales de matrices 
evidencian ser herramientas muy importantes en muchas aplicaciones del álgebra lineal, 
tanto teórica como aplicada. 


Este capítulo concluye como empezó, observando sistemas dinámicos. Las cadenas de 
Markov y el modelo de Leslie de crecimiento poblacional son ejemplos de sistemas di- 
námicos lineales discretos. Cada uno puede describirse mediante una ecuación matri- 
cial de la forma 


Xp+1 = AX; 
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donde el vector x, registra el estado del sistema en el “tiempo” k y A es una matriz cua- 
drada. Como se vio, el comportamiento a largo plazo de dichos sistemas se relaciona con 
los eigenvalores y eigenvectores de la matriz A. El método de potencia explota la natura- 
leza iterativa de tales sistemas dinámicos para aproximar eigenvalores y eigenvectores, y 
el teorema de Perron-Frobenius brinda información especializada acerca del comporta- 
miento a largo plazo de un sistema dinámico lineal discreto cuya matriz de coeficien- 
tes A es no negativa. 

Cuando A es una matriz de 2 X 2, puede describir geométricamente la evolución de un 
sistema dinámico. La ecuación x,,, = Ax; es en realidad una colección infinita de ecua- 
ciones. Al comenzar con un vector inicial x,, se tiene: 


Xx, = AXo 
X, = Ax; 
X, = Ax, 


El conjunto {Xp X X, ...) se llama trayectoria del sistema. (Para propósitos gráficos, 
cada vector en una trayectoria se identificará con su punta, de modo que pueda grafi- 
carse como un punto.) Note que x, = Ax. 


Ejemplo 4.48 


> 


05 0 
SeaA = le E A Para el sistema dinámico X;,, = AX, grafique los primeros cinco 


puntos en las trayectorias con los siguientes vectores iniciales: 
5 0 4 =2 
= b = = d = 
(a) xo H (b) xo [Es (c) xo H (d) xo | 2] 


2.5 1,25 0.625 
Solución (a) Calcule x, = Ax, = f | X% = Ax, = h | Xx, = Ax, = f l 


0.3125 | _ 
X, = ÁX; = o . Estos se grafican en la figura 4.23 y los puntos se conectan para 


resaltar la trayectoria. Cálculos similares producen las trayectorias marcadas (b), (c) y (d) 
en la figura 4.23. 


Figura 4.23 
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En el ejemplo 4.48 toda trayectoria converge en 0. El origen se llama atractor en este 
caso. Puede entender por qué es así a partir del Teorema 4.19. La matriz A en el ejemplo 


1 0 
4.48 tiene cigenectores | y | 4 correspondientes a sus eigenvalores 0.5 y 0.8, respec- 


tivamente. (Compruebe esto.) En concordancia, para cualquier vector inicial 


se tiene 


1 0 
x, = AX% = adosi + oso] 
Puesto que (0.5)* y (0.8)' tienden a cero conforme k se vuelve grande, x, tiende a 0 para 
cualquier elección de x,. Además, del Teorema 4.28 se sabe que, puesto que 0.8 es el eigen- 
0 
valor dominante de A, x, tenderá a un múltiplo del correspondiente eigenvector | | en 


0 
tanto œ # 0 (el coeficiente de x, correspondiente a E En otras palabras, todas las 


trayectorias, excepto las que comienzan en el eje x (donde c, = 0) tenderán al eje y, como 
muestra la figura 4.23. 


> 
Ejemplo 4.49 Analice el comportamiento del sistema dinámico x;,, = AX, correspondiente a la ma- 
| 0.65 el 
triz A = ; 
=0,15 0.65 


A i . i 1 
Solución Los eigenvalores de A son 0.5 y 0.8, con correspondientes eigenvectores | 1 


=1 
y | A respectivamente. (Compruebe esto.) Por tanto, para un vector inicial 


1 =1 
Xo = afi] + ol T [ise tiene 


x = A% = TOH + aoB] 


Una vez más, el origen es un atractor, porque x, tiende a 0 para cualquier elección de x,. 
Si c, + 0, la trayectoria tenderá a la recta que pasa por el origen con vector director 


=1 
| al En la figura 4.24 se muestran varias de tales trayectorias. Los vectores x, donde 


; f l 
c, = 0 están sobre la recta que pasa por el origen con vector director p! y la trayec- 


toria correspondiente en este caso sigue esta recta hacia el origen. 
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Figura 4.24 


Ejemplo 4.50 


=> 
Analice el comportamiento de los sistemas dinámicos X+, = AX; correspondientes a las 
siguientes matrices: 


4 1 [i 05 
wali d wah, 1 | 


Solución (a) Los eigenvalores de A son 5 y 3 con sus correspondientes eigen- 


1 =1 E . ono 
vectores H y | j! respectivamente. En consecuencia, para un vector inicial 


1 =] 
X) = ar + ol r [ese tiene 


1 =1 
x, = AX = TH + aaf A 


Conforme k se vuelve grande, también lo hacen 5* y 3*. En consecuencia, x, se aleja del 
j i i f , f 1 
origen. Puesto que el eigenvalor dominante de 5 tiene correspondiente eigenvector LP 


todas las trayectorias para las que c, 4 0 eventualmente terminarán en el primero o ter- 
cer cuadrantes. Las trayectorias con c) = 0 comenzarán y permanecerán en la recta 


=11 
y = —x, cuyo vector director es | [ivea la figura 4.25(a). 
(b) En este ejemplo, los eigenvalores son 1.5 y 0.5, con sus correspondientes eigenvecto- 


1 =] 
res | | y | Al respectivamente. Por tanto, 


1 
calle] (ed 


Figura 4.25 


Ejemplo 4.51 
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=1 


0 
a > H conforme k — 00. Pero si c, + 0, entonces 


Si c, = 0, entonces x, = cos)! 


x = TOH + a057 = aa] conforme k— o0 


y tales trayectorias se aproximan asintóticamente a la recta y = x. Vea la figura 4.25(b). 


me 


En el ejemplo 4.50(a), todos los puntos que comienzan cerca del origen se vuelven 
cada vez más grandes en magnitud, porque |A| > 1 para ambos eigenvalores; 0 se llama 
repulsor. En el ejemplo 4.50(b), 0 se llama punto de silla, porque el origen atrae puntos 
en algunas direcciones y los repele en otras direcciones. En este caso, |A| < 1. y Jà > 1. 

El siguiente ejemplo muestra lo que puede suceder cuando los eigenvalores de una 
matriz real de 2 X 2 son complejos (y por tanto conjugado de otro). 


, a 4 i i 
Grafique la trayectoria que comienza con X) = P para los sistemas dinámicos 


X+1 = Ax, que corresponden a las siguientes matrices: 


0.5 05 02-12 
MIES [ee da] BHAS p a 


Solución Las trayectorias se muestran en las figuras 4.26(a) y (b), respectivamente. 
Note que (a) es una trayectoria en espiral hacia el origen, mientras que (b) parece seguir 
una órbita elíptica. 
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Figura 4.26 


(a) sil (b) 


Fl siguiente teorema explica el comportamiento en espiral de la trayectoria del ejem- 
plo 4.51 (a). 


Teorema 4.42 


Im 
A 
F 
0 
Figura 4.27 


Sea A = | | Los eigenvalores de A son A = a = bi, y si a y b no son ambos 
a 


cero, entonces A puede factorizarse como 
E l E Ml E q ha) 
b a 0 r|lsenO cos 


donder = |A| = Va? + b’ y 0 es el argumento principal de a + bi. 


Demostración Los eigenvalores de A son 
A = Ha + VAD) = (2a +2VPV-1) =ajbji= a bi 


por el ejercicio 35(b) de la sección 4.1. La figura 4.27 muestra a + bi, r y 0. Se tiene que 


ra f =] B El | B Į alpe l 
b a br ar O r|Lsenó cosQ _ 


a =b 

Comentario  Geométricamente, el Teorema 4.42 implica que cuando A = | b | FO, 
a 

la transformación lineal T(x) = Ax es la composición de una rotación R = 


[es 0 —sen0 


0 
| a través del ángulo 0 seguida por un escalamiento S = Ñ | con 
seng  cos0 0 


r 


factor r (figura 4.28). En el ejemplo 4.51(a), los eigenvalores son A = 0.5 0.5i de 
modo que r = JÀ| =V2/ 2 = 0.707 < 1, y en consecuencia todas las trayectorias caen 
en espiral hacia 0. 

El siguiente teorema muestra que, en general, cuando una matriz real de 2 X 2 tiene 


. . PERE A a = 
eigenvalores complejos, es similar a una matriz de la forma | b | Para un vector 
a 


complejo 
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> 


Escalamiento J Ax = SRx 
Rx 


Rotación 


»x Figura 4.28 
Rotación seguida por un escalamiento 


defina la parte real, Re x, y la parte imaginaria, Im x, de x como 


rex [0] =[*] y mx- [e] [E 


Teorema 4.43 


Sea A una matriz real de 2 X 2 con un eigenvalor complejo A = a — bi (donde b + 0 
y correspondiente eigenvector x. Entonces la matriz P = [Rex  Imx] es invertible y 


A= Eh Ee 
a 


Demostración Seax = u + vi, de modo que Rex = ue Im x = v. De Ax = Ax, se tiene 


Au + Avi = Ax = Ax = (a — bi)(u + vi) 
= au + avi — bui + bv = (au + bv) + (—bu + av)i 
Al igualar las partes real e imaginaria se obtiene 


Au = au + bv y Av= -bu + av 


Ahora P = [u | v], de modo que 


as =] = AR el = [au + bvi—bu + av] = [Au ¡Av] = Afu iv] 


= AP 


Para demostrar que P es invertible, es suficiente con demostrar que u y v son lineal- 
mente independientes. Si u y v no son linealmente independientes, entonces se tendría 
que v = ku para algún escalar k (complejo distinto de cero), porque ni u ni v son 0. Por 
tanto, 


x=u+vi=u+ kui = (1 + ki)u 


Ahora, dado que A es real, Ax = Ax implica que 


AX = Ax = Ax= Ax = Ax 


de modo que x = u — ví es un eigenvector correspondiente al otro eigenvalor 
A = a + bi. Pero 


x = (1 + ki)u = (1 — ki)u 
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dado que u es un vector real. En consecuencia, los eigenvectores x y x de A son ambos 
múltiplos de u distintos de cero y por tanto son múltiplos mutuos. Esto es imposible 
porque los eigenvectores que corresponden a distintos eigenvalores deben ser lineal- 
mente independientes por el Teorema 4.20. (Este teorema es válido para los números 
complejos, así como para los números reales.) 

Esta contradicción implica que u y v son linealmente independientes y en conse- 
cuencia P es invertible. Ahora se tiene que 


—— 


El Teorema 4.43 sirve para explicar el ejemplo 4.51(b). Los eigenvalores de 


0.2 —1. 
A= | i 2] son 0.8 + 0.61. Para A = 0.8 — 0.61, un correspondiente eigenvec- 


>< 
| 
m 
h E. 
~ 
ij 
II 
i 
Rh = 
i—i 
+ 
A 
O = 
1 
a 


=] =] 0.8 —0.6 
Del Teorema 4.43 se deduce que para P = | | yC= | 0 a se tiene 


A=PCP!* y PUAP=C 


Para el sistema dinámico dado, X; +1 = AX» se realiza un cambio de variable. Sea 
Xx; = Py, (o, de manera equivalente y, = P”*x;) 
Entonces 
PYk+1 Xi+1 = AX = APY; 
de modo que 


Yki = Xk+ = AX; = PAPY, = CY 


Ahora C tiene los mismos eigenvalores que A (¿por qué?) y |0.8 + 0.6i| = 1. Por tanto, el 
sistema dinámico y; +, = Cy; simplemente rota los puntos en cada trayectoria en una 
circunferencia en torno al origen, por el Teorema 4.42. 

Para determinar una trayectoria del sistema dinámico del ejemplo 4.51(b), se aplica 
iterativamente la transformación lineal T(x) = Ax = PCP"'x. La transformación se 
puede considerar como la composición de un cambio de variable (de x a y), seguida por 
la rotación determinada por C, seguida por el cambio de variable inverso (y de vuelta a 
x). Esta idea se encontrará nuevamente en la sección 5.5 acerca de la aplicación a la gra- 
ficación de ecuaciones cuadráticas y, de manera más general, como “cambio de base” en 
la sección 6.3. En el ejercicio 96 de la sección 5.5 se le mostrará que la trayectoria del 
ejemplo 4.51(b) de hecho es una elipse, como parece ser en la figura 4.26(b). 

Para resumir: si una matriz A real de 2 X 2 tiene eigenvalores complejos A = a + bi, 
entonces las trayectorias del sistema dinámico X; +, = Ax; giran en espiral hacia adentro 
silA| < 1 (0 es un atractor espiral), giran en espiral hacia afuera si|A] > 1 (0 es un re- 
pulsor espiral) y se encuentran en una órbita cerrada sijA] = 1 (0 es un centro orbital). 


Clasificación de 
equipos deportivos y 
búsqueda en Internet 


En cualquier liga deportiva de competencia, la clasificación de jugadores o equipos no 
necesariamente es un proceso directo. El mero conteo de triunfos y derrotas pasa por 
alto la posibilidad de que un equipo pueda acumular una gran cantidad de victorias con- 
tra equipos débiles, mientras que otro equipo puede tener menos victorias pero todas 
contra equipos fuertes. ¿Cuál de esos equipos es mejor? ¿Cómo deben compararse dos 
equipos que nunca jugaron entre sí? ¿Deben tomarse en cuenta los puntos anotados? 
¿Los puntos en contra? 

A pesar de estas complejidades, la clasificación de los atletas y los equipos deportivos 
se ha vuelto un lugar común y un aspecto muy esperado en los medios de comunicación. 
Por ejemplo, existen varias clasificaciones anuales de equipos estadounidenses de futbol 
americano colegial y basquetbol, y los golfistas y tenistas también se clasifican interna- 
cionalmente. Existen muchos esquemas con derechos de autor registrados que se usan 
para producir tales clasificaciones, pero puede obtener cierta comprensión de cómo 
abordar el problema usando las ideas de este capítulo. 

Para establecer la idea básica, revise el ejemplo 3.69. Cinco tenistas juegan entre ellos 
en un torneo todos contra todos. Triunfos y derrotas se registran en forma de digrafo 
donde una arista dirigida de ¡a j indica que el jugador i venció al jugador j. Por ende, la 
correspondiente matriz de adyacencia A tiene a; = 1 si el jugador i vence al jugador j y 
tiene a; = 0 en caso contrario. 


0 1 0 1 1 
0 0 1 1 1 
5 2 A=|1 0 0 10 
0 0 0 0 1I 
0.0.1.00 
4 3 


Sería apropiado asociar una clasificación r, al jugador i de manera que r; > r; in- 
dique que el jugador i está clasificado más alto que el jugador j. Con este propósito, se 
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f4 


f5 


Más aún, se insiste en que la clasificación del jugador i debe ser proporcional a la suma 
de las clasificaciones de los jugadores vencidos por el jugador i. Por ejemplo, el jugador 
1 vence a los jugadores 2, 4 y 5, de modo que se quiere 


1, = Qlr, + 1, + 15) 
donde a es la constante de proporcionalidad. Al escribir ecuaciones similares para los 
otros jugadores se produce el siguiente sistema: 

r = Qlr, +r, + 15) 

1, = alr; + 1, + 15) 

r, = alri + 1,) 

T, = Qf; 

T; = Qr, 


Observe que puede escribir este sistema en forma matricial como 


fı 0.1.0 1 17 
Ta 00 1 1 1i 
rm|=0qal 0 0 1 Ojiz o r=aAr 
Ta 0 0 0 0 ijir 
T5 0 0 1 0 ojis 


De manera equivalente, vea que el vector de clasificación r debe satisfacer Ar = En En 
otras palabras, įr es un eigenvector que corresponde a la matriz A! = 

Más aún, A es una matriz no negativa primitiva, de modo que el Teorema de Perron- 
Frobenius garantiza la existencia de un vector de clasificación único r. En este ejemplo, el 
vector de clasificación evidencia ser 


0.29 
0.27 
r= | 0.22 
0.08 
0.14 


de modo que los jugadores se clasificarían en el orden 1, 2, 3, 5, 4. 

Al modificar la matriz A es posible tomar en cuenta muchas de las complejidades 
mencionadas en el párrafo de apertura. No obstante, este ejemplo simple sirvió para in- 
dicar un enfoque útil del problema de clasificar equipos. 


En lugar de equipos que juegan entre sí, ahora se tienen sitios web vinculados mu- 
tuamente. Una vez más puede usar un digrafo para modelar la situación, sólo que ahora 
una arista de ¡a j indica que el sitio web i se vincula con (o se refiere a) el sitio web j. De 
este modo, mientras que para el digrafo de equipos deportivos las aristas dirigidas hacia 
adentro son malas (indican derrotas), para el digrafo de Internet las aristas dirigidas 
hacia adentro son buenas (indican vínculos desde otros sitios). En este escenario, se 
quiere que la clasificación del sitio web į sea proporcional a la suma de las clasificaciones 
de todos los sitios web que se vinculan con él. 

Al usar el digrafo de la página 367 para representar sólo cinco sitios web, se tiene 


La Oo T) 
por ejemplo. Es fácil ver que ahora se quiere usar la transpuesta de la matriz de adyacen- 
; A a : 1 
cia del digrafo. Por tanto, el vector de clasificación r debe satisfacer Ar = gr y por 


tanto será el eigenvector de Perron de A”. En este ejemplo, se obtiene 


00100 0.14 
10000 0.08 
A =|0 10 0 1 r =| 0.22 
1 1100| y 0.27 
1 1010 0.29 


de modo que una búsqueda que regrese estos cinco sitios los presentaría en el orden 5, 4, 
3; 1,2, 

En realidad, Google utiliza una variante del método aquí descrito y calcula el vector 
de clasificación mediante un proceso iterativo muy similar al método de potencia (sec- 
ción 4.5). 
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|Hercicios 4.6 


¿Cuáles de las matrices estocásticas de los ejercicios 1-6 son re- 
gulares? 


1 1! 
EJO + 
1 0 o ! 
1 300 1 
3 1 1 
3.13 4.11 0 0 
3 0 
010 
0.1 0 05 05 1 0 18. 
5105 1 0 6.105 0 1 
0.4 0 0.5 0o 0 0 


En los ejercicios 7-9, P es la matriz de transición de una ca- 
dena de Markov regular. Encuentre la matriz de transición de 
rango largo L de P. 


1 1 1 
1 1 2 3 6 
AE a 8. P=|3 35 
g 063 
0.2 03 0.4 
9.P=|06 0.1 0.4 
0.2 0.6 0.2 


10. Demuestre que el vector de probabilidad de estado esta- 
cionario de una cadena de Markov regular es único. 
[Sugerencia: use los Teoremas 4.33 o 4.34.] 


19. 
En los ejercicios 11-14, calcule el eigenvalor positivo y su corres- 


pondiente eigenvector positivo de la matriz de Leslie L. 20. 
0 2 1 15 21. 
11.1 = 12. L = 
0.5 0 0.5 0 cas 22. 
0 7 4 1.5 3 
13.L=|05 0 0| 1M.L=|3 0 0 
0. 05 0 03.0 


15. Si una matriz de Leslie tiene un eigenvalor positivo 
único A, ¿cuál es el significado para la población si 
A >1?5YsiA, <1?;YsiA, = 1? 

16. Verifique que el polinomio característico de la matriz de 
Leslie L en la ecuación (3) es 
alà) = (Y — ba" 

O b,,515 ió il 

[Sugerencia: use inducción matemática y desarrolle det(L — 

AL) alo largo de la última columna.] 


bas ¡ A? — bass? 


17. Si todas las tasas de supervivencia s; son distintas de 
cero, sea 


1 0 0 0 

0.5 0 0 
P=|0 0 ss 0 

0 0 0 $157 *** S 


Calcule P™'LP y úsela para encontrar el polinomio ca- 
racterístico de L. [Sugerencia: consulte el ejercicio 32 de 
la sección 4.3.] 


Verifique que un eigenvector de L correspondiente a A, 
es 


1 
s/M 
s,57/M 
515,53/ A 


515253 Sp 1/M 
[Sugerencia: combine el ejercicio 17 anterior con el 


ejercicio 32 de la sección 4.3 y el ejercicio 46 de la sec- 
ción 4.4.] 


cas En los ejercicios 19-21, calcule la tasa de crecimiento de estado 
estacionario de la población con la matriz de Leslie L del ejer- 
cicio dado. Luego use el ejercicio 18 para encontrar la corres- 
pondiente distribución de las clases etáreas. 


Ejercicio 19 de la sección 3.7 
Ejercicio 20 de la sección 3.7 
Ejercicio 24 de la sección 3.7 


Muchas especies de focas sufren de caza comercial. Las 
cazan por su piel, grasa y carne. El comercio de pieles, 

en particular, redujo algunas poblaciones de focas al 
punto de la extinción. En la actualidad, las más grandes 
amenazas para las poblaciones de focas son el declive de 
los bancos de peces debido a la sobreexplotación, la con- 
taminación, la perturbación del hábitat, los desechos ma- 
rinos y el exterminio de algunas especies por parte de 
dueños de pescaderías. Algunas focas se han declarado es- 
pecies en peligro de extinción; otras especies se adminis- 
tran cuidadosamente. La tabla 4.7 proporciona las tasas 
de natalidad y supervivencia para el lobo marino del 
norte, divididas en clases etáreas de 2 años. [Los datos se 
basan en A. E. York y J. R. Hartley, “Pup Production Follo- 
wing Harvest of Female Northern Fur Seals”, Canadian 
Journal of Fisheries and Aquatic Science, 38 (1981), pp. 84- 
90.] 


Tabla 4.7 
Tasa de Tasa de 
Edad (años) natalidad supervivencia 
0-2 0.00 0.91 
2—4 0.02 0.88 
4—6 0.70 0.85 
6-8 1.53 0.80 
8-10 1.67 0.74 
10-12 1.65 0.67 
12-14 1.56 0.59 
14-16 1.45 0.49 
16-18 1.22 0.38 
18-20 0.91 0.27 
20-22 0.70 0.17 
22-24 0:22 0.15 
24-26 0.00 0.00 


(a) Construya la matriz de Leslie L para estos datos y 
calcule el eigenvalor positivo y su correspondiente 
elgenvector positivo. 

(b) A largo plazo, ¿qué porcentaje de lobos marinos es- 
tará en cada clase etárea y cuál será la tasa de creci- 
miento? 


El ejercicio 23 muestra que el comportamiento a largo plazo 
de una población puede determinarse directamente de las en- 
tradas de su matriz de Leslie. 


23. La tasa de reproducción neta de una población se define 27 


como 


r= bi + bas, + b35¡5, +00 ++ bysit s 


n—1 
donde las b, son las tasas de natalidad y las s; son las tasas de 
supervivencia para la población. 

(a) Explique por qué r puede interpretarse como el nú- 
mero promedio de hijas nacidas de una sola hembra 
durante su vida. 

(b) Demuestre que r = 1 si y sólo si A, = 1. (Esto repre- 
senta crecimiento poblacional cero.) [Sugerencia: sea 

bi bası  b3s¡s) 


b,5152 “0 Sy-1 
A =>+ + Hee 
ES ) A X A à” 


Demuestre que À es un eigenvalor de L si y sólo si 
ga) =1,] 

(c) Suponga que existe un eigenvalor positivo único A, 
y demuestre que r < 1 si y sólo si la población dis- 
minuye y r > 1 si y sólo si la población aumenta. 


Una política de reproducción sustentable es un procedimiento 
que permite que cierta fracción de una población (represen- 
tada por un vector de distribución de población x) se repro- 
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duzca de modo que la población regrese a x después de un in- 
tervalo de tiempo (donde un intervalo de tiempo es la longitud 
de una clase etárea). Si h es la fracción de cada clase etárea 
que se reproduce, entonces el procedimiento de reproducción 
puede expresarse matemáticamente del modo siguiente: si co- 
mienza con un vector de población x, después de un intervalo 
de tiempo se tiene Lx; la reproducción remueve hLx, lo que 
deja 


Lx — hLx = (1 — h)Lx 
La sustentabilidad requiere que 
(1 — h)lx =x 


24. Si A, es el único eigenvalor positivo de una matriz de 
Leslie L y h es la tasa de reproducción sustentable, 
pruebe que h = 1 — 1/2. 


cas 25. (a) Encuentre la proporción de reproducción sustenta- 


ble para el caribú de bosque del ejercicio 42 de la 
sección 3.7. 

(b) Con los datos del ejercicio 42 de la sección 3.7, re- 
duzca la manada de caribúes de acuerdo con su res- 
puesta al inciso (a). Verifique que la población re- 
gresa a su nivel original después de un intervalo de 
tiempo. 

26. Encuentre la tasa de reproducción sustentable para el 
lobo marino del ejercicio 22. (Los conservacionistas han 
tenido que reproducir poblaciones de lobos marinos 
cuando la sobreexplotación pesquera redujo el suminis- 
tro de alimento disponible al punto en que los lobos 
marinos están en peligro de morir de inanición.) 


. Sea L una matriz de Leslie con un eigenvalor positivo 
único A,. Demuestre que si À es cualquier otro eigenva- 
lor (real o complejo) de L, entonces |A| <= A,. [Sugeren- 
cia: escriba A = r(cos 0 + i sen 0) y sustitúyala en la 
ecuación g(A) = 1, como en el inciso (b) del ejercicio 
23. Use el Teorema de De Moivre y luego tome la parte 
real de ambos lados. Le resultará útil la desigualdad del 
triángulo.] 


El Teorema de Perron-Frobenius 


En los ejercicios 28-31, encuentre la raíz de Perron y el corres- 
pondiente eigenvector de Perron de A. 


2 0 1 3 
m a 
1 1 2 0 
0 1 1 2 1 1 
30.4A=|1 0 1 31.4A=|1 1 0 
1.1.0 1 0 1 


Es posible demostrar que una matriz de n X n no negativa es 
irreductible si y sólo si (I + A)""* > O. En los ejercicios 32- 
35, use este criterio para determinar si la matriz A es irreduc- 
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tible. Si A es reducible, encuentre una permutación de sus ren- 
glones y columnas que ponga A en la forma por bloques. 


ka 
OD 
0010 0010 
00 0 1 0.0.1 1 
32. A = 33.4 = 
0100 1000 
1000 irio 0 
01000 01000 
00101 00001 
34.A=|1 0 1 0 1|354=|1 0 0 0 1 
00110 00100 
10000 00011 


36. (a) Si A es la matriz de adyacencia de un grafo G, de- 
muestre que A es irreductible si y sólo si G está co- 
nectado. (Un grafo está conectado si existe una ruta 
entre cada par de vértices.) 

(b) ¿Cuál de los grafos de la sección 4.0 tiene una matriz 
de adyacencia irreductible? ¿Cuál tiene una matriz 
de adyacencia primitiva? 

37. Sea G un grafo bipartito con matriz de adyacencia A. 

(a) Demuestre que A no es primitiva. 

(b) Demuestre que si A es un eigenvalor de A, también 
lo es —A. [Sugerencia: use el ejercicio 78 de la 
sección 3.7 y la partición de un eigenvector para 
A de modo que sea compatible con este particiona- 
miento de A. Use esta partición para encontrar un 
eigenvector para —A.] 


38. Un grafo se llama k-regular si k aristas se unen en cada 

vértice. Sea G un grafo k-regular. 

(a) Demuestre que la matriz de adyacencia A de G tiene 
A = k como eigenvalor. [ Sugerencia: adapte el Teo- 
rema 4.30.] 

(b) Demuestre que, si A es primitiva, entonces los otros 
eigenvalores son menores que k en valor absoluto. 
(Sugerencia: adapte el Teorema 4.31.) 


39. Explique los resultados de su exploración en la sección 
4.0 a la luz de los ejercicios 36-38 y la sección 4.5. 


En el ejercicio 40, el valor absoluto de una matriz A = [a;;] se 
define como la matriz |A| = [|a;;|] 


40. Sean A y B matrices de n X n, x un vector en R” y c un 
escalar. Pruebe las siguientes desigualdades matriciales: 


(a) [ca] = [e A] (b) |A + B| = |A| + |B| 
(c) |Ax| = |A] [x| (d) |AB| = |A]|B| 


a a 
41. Pruebe que una matriz A = | © "| de2X2es 
%1 An 


reducible si y sólo si a}, = 0 o a, = 0. 


42. Sea A una matriz no negativa irreductible tal que I — A 
sea invertible e (I — A)? = O. Sea A, y v, la raíz de Pe- 
rron y el eigenvector de Perron de A. 

(a) Pruebe que 0 < A, < 1. [Sugerencia: aplique el 
ejercicio 22 de la sección 4.3 y el Teorema 4.18(b).] 
(b) Deduzca a partir de (a) que v, > Av}. 


Relaciones de recurrencia lineal 

En los ejercicios 43-46, escriba los primeros seis términos de la 
sucesión definida por la relación de recurrencia con las condi- 
ciones iniciales dadas. 


43. xy = 1,x, = 2x,-, paran = 1 


44. a, = 128, a, = a,-,/2 paran = 2 


45. Yo = 0, y1 = 1l, Yn = Yui — Yn- paran = 2 


46. ba = 1, b, = 1, b, = 2b, + b, paran = 2 


En los ejercicios 47-52, resuelva la relación de recurrencia con 
las condiciones iniciales dadas. 
47. x = 0, x1 = 5, X, = 3X, 1 + 4X, para n = 2 


48. xy = 0, x1 = 1,x, = 4x1 — 3X,_2 para n = 2 


49. y, = l, y2 = 6, Yn = 4n- T 4Yn— para n = 3 


50. 4, = 4 a, = 1,4, = 4,1 — An—2/4 para n = 2 


51. b} = 0, b, = 1, b, = 2b,, , + 2b, para n = 2 


52. En la relación de recurrencia en el ejercicio 45. Demues- 
tre que su solución concuerda con la respuesta al ejerci- 
cio 45. 


53. Complete la demostración del Teorema 4.38(a) al de- 
mostrar que si la relación de recurrencia x, = ax, _, + 
bx, _, tiene distintos eigenvalores A, + A, entonces la 
solución será de la forma 


Xy = CA] + OA 


[Sugerencia: demuestre que el método del ejemplo 4.40 
funciona en general.] 

54. Demuestre que para cualquier elección de condiciones 
iniciales x, = r y x, = s, los escalares c} y c, pueden 
encontrarse, como se afirma en el Teorema 4.38(a) 

y (b). 

55. La recurrencia de Fibonacci f, = f,_, + f,- tiene la 

ecuación matricial asociada x, = Ax,_,, donde 
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fa 1 1 56. Usted tiene un suministro de tres tipos de mosaicos: dos 
sd di E tipos de mosaicos de 1 X 2 y un tipo de mosaico de 


1 X 1, como se muestra en la figura 4.30. 
(a) Con h = 0 yfi = 1, use inducción matemática para 


demostrar que 


oi — 


fa fiai Figura 4.30 


para todo n = 1. Sea t, el número de diferentes formas de cubrir un 


(b) Con el inciso (a), demuestre que rectángulo de 1 X n con estos mosaicos. Por ejemplo, la 
ofnai figura 4.31 muestra que t, = 5. 
fasi n-1 n= ( 1) 
(a) Encuentre f,,..., És. 

para toda n = 1. [Esta se llama identidad de »—> (Tiene algún sentido f? Si es así, ¿cuál es?) 
Cassini, en honor del astrónomo Giovanni Dome- (b) Establezca una relación de recurrencia de segundo 
nico Cassini (1625-1712). Cassini nació en Italia orden para t, 
pero, a invitación de Luis XIV, se mudó a Francia en (c) Con t, y t, como condiciones iniciales, resuelva la 
1669, donde se convirtió en el director del Observa- relación de recurrencia en el inciso (b). Verifique su 
torio de París. Se convirtió en ciudadano francés y respuesta con los datos del inciso (a). 


adoptó la versión francesa de su nombre: Jean-Do- 
minique Cassini. Las matemáticas fueron uno de sus 
principales intereses, además de la astronomía. La 


Identidad de Cassini se publicó en 1680 en un Y ES 
artículo enviado a la Real Academia de Ciencias Mm | Ea 
de París. ] 


(c) Un tablero de ajedrez se puede dividir como se 
muestra en la figura 4.29(a) y las piezas se reacomo- 
dan en un rectángulo de 5 X 13 de la figura 4.29(b). 
El área del cuadrado tiene 64 unidades cuadradas, 


¡pero el área del rectángulo es de 65 unidades cua- 
dradas! ¿De dónde provino el cuadrado adicional? — E 
Figura 4.31 


Las cinco formas de cubrir un rectángulo de 1 X 3 
con los mosaicos 


57. Usted tiene un suministro de fichas de dominó de 1 X 2 
con las cuales cubrir un rectángulo de 2 X n. Sea d,, el 
número de diferentes formas de cubrir el rectángulo. 
Por ejemplo, la figura 4.32 muestra que d, = 3. 


(a) 
(b) 
Figura 4.29 
Figura 4.32 
[Sugerencia: ¿qué tiene que ver esto con la sucesión Las tres formas de cubrir un rectángulo de 2 X 3 con 


de Fibonacci? |] fichas de dominó de 1 X 2 
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(a) Encuentre d,,..., d;. 
»-—» (Tiene algún sentido d,? Si lo tiene, ¿cuál es?) 
(b) Establezca una relación de recurrencia de segundo 
orden para d, 
(c) Con d, y d, como condiciones iniciales, resuelva la 
relación de recurrencia en el inciso (b). Verifique su 
respuesta con los datos del inciso (a). 


58. En el ejemplo 4.41, encuentre eigenvectores v, y v, que 


LEVE. SNS 


correspondan a A, = z I% J Con 


X; = | Pa | verifique la fórmula (2) de la sección 4.5. 
k-1 


Esto es, demuestre que, para algún escalar c}, 


(ES 

En los ejercicios 59-64, encuentre la solución general al sistema 
dado de ecuaciones diferenciales. Luego encuentre la solución 
específica que satisfaga las condiciones iniciales. (Considere 
todas las funciones como funciones de t.) 


59. x' = x+ 3y, x(0)=0 
y! =2x+ 2y, y(0)=5 
60.x' = 2x— y, x(0)=1 
y ==x+2y, y(0)=1 
6l. x =x +x, x(0)=1 
x= xax x2(0)=0 
62. y1 = yı =Y» y(0)=1 
y =y +y» y(0)=1 
63. x' = yz  x(0) 1 
y =x+ z y(0)= 0 
zZ =x+y, z(0) = —1 
64.x' = x+ 3z, x(0) = 
y= x=2y+ z y(0)=3 
z =3x + z z(0)= 


65. Un científico coloca dos cepas de bacterias, X y Y, en una 
caja de Petri. Inicialmente, existen 400 de X y 500 de Y. 
Las dos bacterias compiten por alimento y espacio pero 
no se alimentan una de la otra. Si x = x(t) y y = y(t) 
son los números de las cepas en el tiempo t días, las 
tasas de crecimiento de las dos poblaciones están dadas 
por el sistema 


x' = 1.2x — 0.2y 
y! = —0.2x + 1.5y 


(a) Determine qué le ocurre a estas dos poblaciones al 
resolver el sistema de ecuaciones diferenciales. 


(b) Explore el efecto de cambiar las poblaciones inicia- 
les al hacer x(0) = ay y(0) = b. Describa lo que ocu- 
rre con las poblaciones en términos de a y b. 


66. Dos especies, X y Y, viven en una relación simbiótica. 
Esto es, ninguna especie puede sobrevivir por cuenta 
propia y cada una depende de la otra para su supervi- 
vencia. Inicialmente, hay 15 de X y 10 de Y. Six = x(t) y 
y = y(t) son los tamaños de las poblaciones en el 
tiempo t meses, las tasas de crecimiento de las dos po- 
blaciones están dadas por el sistema 


x’ = —0.8x + 0.4y 
y'= 0.4x — 0.2y 


Determine lo que le pasa a estas dos poblaciones. 


En los ejercicios 67 y 68, la especie X depreda a la especie Y. 
Los tamaños de las poblaciones se representan mediante x = 
x(t) y y = y(t). La tasa de crecimiento de cada población está 
gobernada por el sistema de ecuaciones diferenciales x' = Ax 


x 
+ b, donde x = | | y b es un vector constante. Determine 
y 


qué le ocurre a las dos poblaciones para los A y b dados y las 
condiciones iniciales x(0). (Primero demuestre que existen 
constantes a y b tales que las sustituciones x = u + ayy = v 
+ b convierten el sistema en uno equivalente sin términos 
constantes.) 


1 1l —30 20 
[lo > 
Zi Mi ro 10 
de | E ME a 0) = | 39 
68. 


69. Sea x = x(t) una función dos veces derivable y consi- 
dere la ecuación diferencial de segundo orden 


x" +ax'+bx=0 (11) 


(a) Demuestre que el cambio de variables y = x' y z = 
x permite a la ecuación (11) escribirse como un sis- 
tema de dos ecuaciones diferenciales lineales en y y z. 

(b) Demuestre que la ecuación característica del sistema 
en el inciso (a) es A? + aà + b = 0. 


70. Demuestre que hay un cambio de variables que con- 
vierte la ecuación diferencial de n-ésimo orden 


a a nd a + a9=0 


en un sistema de n ecuaciones diferenciales lineales cuya 
matriz de coeficientes es la matriz acompañante C(p) 
del polinomio p(A) = A” + a, ¡AT +- + aÀ + ap. 
[La notación x® denota la k-ésima derivada de x. Vea en 
los ejercicios 26-32 de la sección 4.3 la definición de una 
matriz acompañante.] 


En los ejercicios 71 y 72, use el ejercicio 69 para encontrar la 
solución general de la ecuación dada. 


71. x” — 5x' +6x=0 72.x” +4x" +3x=0 


En los ejercicios 73-76, resuelva el sistema de ecuaciones dife- 
renciales en el ejercicio dado usando el Teorema 4.41. 


73. Ejercicio 59 74. Ejercicio 60 
75. Ejercicio 63 76. Ejercicio 64 


En los ejercicios 77-84, considere el sistema dinámico 
Xp+1  AXg 


1 
(a) Calcule y grafique Xv Xi» X» X para Xy = | l : 


1 
(b) Calcule y grafique Xp X;, X,, X para X, = A ; 


(c) Con eigenvalores y eigenvectores, clasifique el origen como 
atractor, repelente, punto de silla o ninguno de los anteriores. 
(d) Bosqueje varias trayectorias típicas del sistema. 


TAE 2 A a [0.5 E 

' LO 3 ' LO 0.5 
af 2 i _ [4 2 

79. A = pee l 80. A = Es al 
ETA 1.5 El aas 0.1 T 
[-1 0 0.5 0.5 

TS | 02 a uds PO =i] 

| 0.2 0.8 [1.2 3.6 


Repaso del capítulo 315 


En los ejercicios 85-88, la matriz dada es de la forma 
q E =b 
b a 
producto de una matriz de escalamiento y una matriz de rota- 
ción. Encuentre el factor de escalamiento r y el ángulo de 
rotación 0. Grafique los primeros cuatro puntos de la trayecto- 


| En cada caso, A puede factorizarse como el 


1 
clasifique el origen como un atractor espiral, un repelente espi- 
ral o un centro orbital. 


ib =l 
a 
1 1 


A f ; 1 
ria para el sistema dinámico X; = AX, con X) = | y 


0 A 
-05 0 
E E a] 88. A = mao nl 


En los ejercicios 89-92, encuentre una matriz invertible P y 


s.a = | 


=b 
una matriz C de la forma C = f | tal que 
a 


A = PCP. Grafique los primeros seis puntos de la trayecto- 


1 
clasifique el origen como atractor espiral, repelente espiral o 
centro orbital. 


0.1 —02 2 1 
59.4 = | | 9.a =| | 


01 03 
91. A = E El 92 a[i A 
' : 1 vV 


1 
ria para el sistema dinámico X; +1 = AX, con Xo = | y 


1 0 


Definiciones y conceptos clave 


adjunta de una matriz, 287 
determinante, 274-276 
disco de Gerschgorin, 330 


ecuación característica, 303 


322-330 


eigenespacio, 267 eigenvalor, 305 
eigenvalor, 265 
eigenvector, 265 eigenvalor, 305 


expansión por cofactores, 277 


matrices semejantes, 312 


1. Marque cada uno de los siguientes enunciados como 
verdadero o falso: 


matriz diagonalizable, 314 
método de potencia (y sus variantes), 


multiplicidad algebraica de un 
multiplicidad geométrica de un 


polinomio característico, 303 


propiedades de los determinantes, 
280-285 

regla de Cramer, 285-286 

teorema de expansión de Laplace, 
277 

teorema del disco de Gerschgorin, 332 

teorema fundamental de las matrices 
Invertibles, 307 


(a) Para toda matriz cuadrada A, det(—A) = —det A. 
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(b) Si A y B son matrices de n X n, entonces det(AB) = 
det (BA). 

(c) Si A y B son matrices de n X n cuyas columnas son 
iguales pero en diferente orden, entonces 
det B = —det A. 

(d) Si A es invertible, entonces det(A7*) = det A”. 

(e) Si 0 es el único eigenvalor de una matriz cuadrada 
A, entonces A es la matriz cero. 

(£) Dos eigenvectores que corresponden al mismo ei- 
genvalor deben ser linealmente dependientes. 

(g) Si una matriz de n X n tiene n eigenvalores distin- 
tos, entonces debe ser diagonalizable. 

(h) Si una matriz de n X n es diagonalizable, entonces 
debe tener n eigenvalores distintos. 

(i) Las matrices semejantes tienen los mismos eigen- 
vectores. 

(j) Si A y B son dos matrices de n X n con la misma 
forma escalonada reducida por renglones, entonces 
A es semejante a B. 


1 3 5 
2.Sea4=|3 5 71. 
7 9 11 


(a) Calcule det A mediante expansión por cofactores a 
lo largo de cualquier renglón o columna. 
(b) Calcule det A al reducir primero A a la forma trian- 


gular. 
abc 3d 2e- 4f f 
3. Sild e f| = 3, encuentre |3a 2b—4c c 
g h 1 3g 2h-= 41 i 
4. Sean A y B matrices de 4 X 4 con det A = 2 y 
det B = —¿. Encuentre det C para la matriz C indicada: 
(a) C=(AB)” (b) C = A°B(3A") 


5. Si A es una matriz de n X n antisimétrica y n es impar, 
pruebe que det A = 0. 
6. Encuentre todos los valores de k para los cuales 


1 -1 2 
1 1 k|=0. 
2 4 Kẹ 


En las preguntas 7 y 8, demuestre que x es un eigenvector de A 
y encuentre el correspondiente eigenvalor. 


ra= [ija E i 


3 13 —60 —45 
8& x= 1|}, A= 5 18 15 
2 10 —40 -—32 
—5 —6 3 
9. Sea A = 3 4 =3: 


10. 


11. 


12. 


(a) Encuentre el polinomio característico de A. 

(b) Encuentre todos los eigenvalores de A. 

(c) Encuentre una base para cada uno de los eigenespa- 
cios de A. 

(d) Determine si A es diagonalizable. Si A no es diagona- 
lizable, explique por qué no. Si A es diagonalizable, 
encuentre una matriz invertible P y una matriz dia- 
gonal D tales que P™'AP = D. 


Si A es una matriz diagonalizable de 3 X 3 con eigenva- 
lores —2, 3 y 4, encuentre det A. 

Si A es una matriz de 2 X 2 con eigenvalores A, = 3, A, = —1, 
y correspondientes eigenvectores 


1 1 ME 
v= i V = e , encuentre A JV 


Si A es una matriz diagonalizable y todos sus eigenvalores 
satisfacen |A| < 1, demuestre que A” tiende a la matriz 
cero conforme n se vuelve grande. 


En las preguntas 13-15, determine, con razones, si A es seme- 
jante a B. Si A ~ B, proporcione una matriz invertible P tal 
que P`! AP = B. 


15. 


16. 


17. 
18. 


19. 


20. 


1 1 0 1 1 0 
A=|0 1 1|B=]|0 1 0 
0 0 1 0 0 1 


2 k 
Sea A = k l |! Encuentre todos los valores de k para 


los cuales: 

(a) A tiene eigenvalores 3 y — 1. 

(b) A tiene un eigenvalor con multiplicidad algebraica 2. 
(c) A no tiene eigenvalores reales. 


Si A? = A, ¿cuáles son los posibles eigenvalores de A? 


Si una matriz cuadrada A tiene dos renglones iguales, 
¿por qué A debe tener al 0 como uno de sus eigenvalores? 
Si x es un eigenvector de A con eigenvalor A = 3, de- 
muestre que x también es un eigenvector de 

A? — 5A + 21. ¿Cuál es el eigenvalor correspondiente? 

Si A es semejante a B, con P"!AP = B, y x es un eigenvec- 
tor de A, demuestre que P”!x es un eigenvector de B. 


oi 3.0 Introducción: sombras en la pared 


escoceses, Douglas, que trepa a 


caballo una colina ) g `X , . 
En este capítulo se extenderá la noción de proyección ortogonal que encontró por primera 


perpendicular. .. 
—William Shakespeare vez en el capítulo 1 y luego nuevamente en el capítulo 3. Hasta el momento sólo se han es- 
Enrique IV, Parte I, Acto II, tudiado proyecciones sobre un solo vector (o, de manera equivalente, el subespacio unidi- 
Escena IV mensional generado por dicho vector). En esta sección se verá si es posible encontrar las 
fórmulas análogas para la proyección sobre un plano en R°. La figura 5.1 muestra lo que 
ocurre, por ejemplo, cuando rayos de luz paralelos crean una sombra en una pared. Un 
proceso similar ocurre cuando un objeto tridimensional se despliega sobre una pantalla 
bidimensional, como un monitor de computadora. Más adelante en este capítulo se con- 
siderarán estas ideas en toda su generalidad. 
Para comenzar, recuerde lo que ya sabe acerca de las proyecciones. En la sección 3.6 se 
demostró que, en R?, la matriz estándar de una proyección sobre la recta que pasa por 
f f d 
el origen con vector director d = | ~ | es 
y 2 
2 2 2 2 2 2 
P= 1 | di ua 2 | di/(di + d3) d,d,/(d; T d 
d+ ldd, dl lad/(d+a)  d/(a + al) 
Por tanto, la proyección del vector v sobre esta recta es justo Pv. 
Figura 5.1 Problema 1 Demuestre que P puede escribir en la forma equivalente 
Las sombras sobre una pared son oso coso sent 
proyecciones P= i 
cosĝð senð  sen“0 


»—> (¿Qué representa 0 aquí?) 
Problema 2 Demuestre que P también puede escribirse en la forma P = uu”, donde 
u es un vector unitario en la dirección de d. 
Problema 3 Con el problema 2, encuentre P y luego encuentre la proyección de 


3 Bats F MS 
v= | d sobre las rectas con los siguientes vectores directores unitarios: 


ousia Ol] os 


Problema 4 Con la forma P = uu”, demuestre que (a) P” = P (esto es, P es simétrica) 
y (b) P? = P (esto es, P es idempotente). 
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Problema 3 Explique por qué si P es una matriz de proyección de 2 X 2, la recta 
sobre la que proyecta vectores es el espacio columna de P. 


Ahora avance hacia R? y considere las proyecciones sobre los planos a través del ori- 
gen. Se explorarán varios enfoques. 

La figura 5.2 muestra una forma de proceder. Si P es un plano que pasa por el origen 
en R? con vector normal n, y si v es un vector en R?, entonces p = proyo (v) es un vec- 
tor en Y tal que v — cn = p para algún escalar c. 


n 
v 

—cn 

p P cn 


Figura 5.2 


Proyección sobre un plano 


Problema 6 Con el hecho de que n es ortogonal a todo vector en W, resuelva v — 
cn = p para c y encuentre una expresión para p en términos de v y n. 
Problema 7 Use el método del problema 6 para encontrar la proyección de 


=2 
sobre los planos con las siguientes ecuaciones: 
(a) x+y+z=0 (b)x-22=0 (c) 2x-— 3y+z=0 


Otro enfoque del problema de encontrar la proyección de un vector sobre un plano 
se sugiere a partir de la figura 5.3. Puede descomponer la proyección de v sobre P en la 
suma de sus proyecciones sobre los vectores directores para P. Esto funciona sólo si los 
vectores directores son unitarios ortogonales. En concordancia, sean u, y u, vectores di- 
rectores para P con la propiedad de que 


fal = lu =1 y u-.u=0 
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Por el problema 2, las proyecciones de v sobre u, y u, son 
= T, = T, 
Pp: =Z uuy y P= Uuv 


respectivamente. Para demostrar que p, + p, produce la proyección de v sobre P, es ne- 
cesario demostrar que v — (p, + p,) es ortogonal al plano P. Es suficiente demostrar 
que v — (p; + p,) es ortogonal tanto a u, como a u,. (¿Por qué?) 

Problema 8 Demuestre que u, + (v — (p; + p,)) =0yu,- (v — (p; + p,) =0. 
[Sugerencia: use la forma alternativa del producto punto, x"y = x- y, junto con el hecho 
de que u; y u, son vectores unitarios ortogonales. ] 


Del problema 8, y de los comentarios que lo anteceden se tiene que la matriz de la 
proyección sobre el subespacio P de R? generado por los vectores unitarios ortogonales 
u, y u, es 


P = uu! + uu! (1) 


Problema 9 Repita el problema 7 usando la fórmula para P dada por la ecuación 
(1). Use el mismo v y use u, y u,, como se indica a continuación. (Primero, verifique que 
u; y u, son vectores unitarios ortogonales en el plano dado.) 


—2/V6 0 
(a) x+y+z=0conu;, = 1/V6 | yu, =| 1/V2 
1/V6 —1/V2 
2/V5 0 
(b) x—2z=0conu, = 0 |yw=]1l 
1/V5 0 
1/V3 2/V6 
(c) 2x — 3y + z = 0 conu =|-1/V3 |yw =| 1/v6 
1/73 -1/V6 


Problema 10 Demuestre que una matriz de proyección dada por la ecuación (1) sa- 
tisface las propiedades (a) y (b) del problema 4. 

Problema 11 Demuestre que la matriz P de una proyección sobre un plano en R? 
puede expresarse como 


P = AA" 
para alguna matriz A de 3 X 2. [Sugerencia: demuestre que la ecuación (1) es una ex- 
pansión de producto exterior. ] 


Problema 12 Demuestre que si P es la matriz de una proyección sobre un plano en 
R’, entonces rango(P) = 2. 


En este capítulo se analizarán los conceptos de ortogonalidad y proyección ortogo- 
nal con mayor detalle. Se verá que las ideas introducidas en esta sección pueden genera- 
lizarse y que tienen muchas aplicaciones importantes. 


Ortogonalidad en R” 


En esta sección se generalizará la noción de ortogonalidad de vectores en R” desde dos 
vectores hasta conjuntos de vectores. Para hacerlo, se verá que dos propiedades facilita- 
rán el trabajo con las bases estándar {e}, e,, . . . , €e,) de R”: primera, dos vectores distin- 
tos cualesquiera en el conjunto son ortogonales. Segunda, cada vector en el conjunto es 
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unitario. Estas dos propiedades conducen a la noción de bases ortogonales y bases orto- 
normales, conceptos que podrán aplicarse fructíferamente a varias aplicaciones. 


Definición Un conjunto de vectores [v,, v» . . ., v,) en R” se llama conjunto 
ortogonal si todos los pares de vectores distintos en el conjunto son ortogonales; esto 
es, si 


v,*v=0 siempreque ++] para] TP E 


La base estándar [e,, €, . . . , €,) de R” es un conjunto ortogonal, como lo es cualquier 
subconjunto del mismo. Como ilustra el primer ejemplo, existen muchas otras posibili- 
dades. 


Ejemplo 5.1 


Po 


hs: v2 


vi 


Figura 5.4 


Un conjunto ortogonal de vectores 


Demuestre que {v}, v,, v,) es un conjunto ortogonal en R° si 


2 0 1 
y= lh v=|lij v=|-1l 
=1 1 1 


Solución Debe demostrar que todo par de vectores de este conjunto es ortogonal. Esto 
es verdadero, pues 


vı +v = 2(0) + 1(1) + (=1)0) = 
vv = 001) + 121) + (1)(1) = 
viv = 2(1) + (1) + (=D) = 0 


Geométricamente, los vectores del ejemplo 5.1 son mutuamente perpendiculares, 


como lo muestra la figura 5.4. 


Una de las principales ventajas de trabajar con conjuntos ortogonales de vectores es 
que necesariamente son linealmente independientes, como lo muestra el Teorema 5.1. 


Teorema 5.1 


Si {V V» . - -> V,) es un conjunto ortogonal de vectores distintos de cero en R”, en- 
tonces dichos vectores son linealmente independientes. 


Demostración Sic,,...,c, son escalares tales que civ; +++ + cv, = 0, entonces 
(cavi ++ cv) v¡ =0-v,=0 
o, de manera equivalente, 
alvi vi) + o + ely; vi) ++ + adv, vi) =0 (2) 


Dado que {v}, V» . . ., v,) es un conjunto ortogonal, todos los productos punto en la 
ecuación (2) son cero, excepto v; + v;. Por tanto, la ecuación (2) se reduce a 


c(v;*v;) =0 
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Ahora, v;*v, Æ 0 porque v; % 0, por hipótesis. Así que debe tener c; = 0. El hecho de que 
esto sea cierto para todo i = 1,..., k implica que [v,, V», .. . , v,) es un conjunto lineal- 
mente independiente. — E 


Comentario Gracias al Teorema 5.1 se sabe que, si un conjunto de vectores es ortogo- 
nal, automáticamente es linealmente independiente. Por ejemplo, inmediatamente 
puede deducir que los tres vectores en el ejemplo 5.1 son linealmente independientes. 
¡Compare este planteamiento con el trabajo necesario para establecer directamente su 
independencia lineal! 


Definición Una base ortogonal para un subespacio W de R" es una base de W 
que es un conjunto ortogonal. 


Ejemplo 5.2 Los vectores 


2 0 1 
v= lhl vw=|l| v=j|-1 
=] 1 1 


del ejemplo 5.1 son ortogonales y, por ende, linealmente independientes. Dado que cua- 
lesquiera tres vectores linealmente independientes en R? forman una base para R?, por 
el teorema fundamental de las matrices invertibles, se tiene que {Vv}, v,, V3} es una base or- 


togonal para R’. 


Comentario En el ejemplo 5.2, suponga que sólo se proporcionaron los vectores or- 
togonales v, y v,, y que se le pidió encontrar un tercer vector v, para hacer a {v}, v,, V3} 
una base ortogonal para R’. Una forma de hacer esto es recordar que en R? el producto 
cruz de dos vectores v, y v, es ortogonal a cada uno de ellos. (Vea la Exploración: “El pro- 
ducto cruz”, en el capítulo 1.) Por tanto, se tiene 


2 0 2 
v= X v, = 1|x|1|=|-2 
=1 1 2 


Note que el vector resultante es un múltiplo del vector v, en el ejemplo 5.2, como debe 
ser. 


Ejemplo 5.3 Encuentre una base ortogonal para el subespacio W de R? dado por 


x 
W=a3|y|:x=y+22=0 
z 
Solución La sección 5.3 ofrece un procedimiento general para los problemas de este 
tipo. Por ahora, se encontrará la base ortogonal mediante fuerza bruta. El subespacio W 
es un plano que pasa por el origen en R’. A partir de la ecuación del plano se tiene x = 
y — 2z, de modo que W consiste de vectores de la forma 
y= 2z 1 =2 
y =y1|+z| 0 
Z 0 1 
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1 =2 
Se tiene queu=|1|yv= 0 | son una base para W, pero no son ortogonales. Es 
0 1 


suficiente encontrar otro vector distinto de cero en W que sea ortogonal a cualquiera de 


ellos. 
x 


Suponga que w = | y | es un vector en W que es ortogonal a u. Entonces x — y + 2z 
z 
= 0, pues w está en el plano W. Dado que u - w = 0, también se tiene x + y = 0. Al re- 
solver el sistema lineal 


x—y+2z=0 


xy =0 
se encuentra que x = —z y y = z. (Compruebe esto.) Por tanto, cualquier vector w dis- 
tinto de cero de la forma 
=z 
w=] z 
z 
=1 
será adecuado. Para ser específicos, podría tomar w = 1 |. Es fácil comprobar que 
1 


[u, w} es un conjunto ortogonal en W y, por tanto, una base ortogonal para W, pues 


dim W= 2. 


Otra ventaja de trabajar con una base ortogonal es que las coordenadas de un vector 
con respecto a tal base son fáciles de calcular. De hecho, hay una fórmula para dichas co- 
ordenadas, como establece el siguiente teorema. 


Teorema 5.2 


Sea [v,, V» . . - , V,) una base ortogonal para un subespacio W de R” y sea w cualquier 
vector en W. Entonces los escalares únicos c}, . . . , €, tales que 


W = CV] +: F Cv 


están dados por 


nz 1 
G= ara i= 1,... 
1 v; A vi p > 2 
Demostración Dado que {v}, V», ... ., v,) es una base para W, se sabe que existen escala- 
res únicos C}, . . . , C tales que w = c,v, +++ + cv, (del Teorema 3.29). Para establecer la 


fórmula para c, se toma el producto punto de esta combinación lineal con v, para 
obtener 


wev; = (cv, He + Cova) + vi 
= afvi vi) H + aviv) + + + alve v) 
= c(v;. v;) 


pues v;* v; = 0 para j + i. Dado que v; + 0, v;+ v; + 0. Al dividir entre v; v, se obtiene el 
resultado deseado. 
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=> 
Ejemplo 5.4 1 
Encuentre las coordenadas de w = | 2 | con respecto a la base ortogonal B = {v;, vz, v3) 
3 


de los ejemplos 5.1 y 5.2. 


Solución Con el Teorema 5.2, calcule 


W:v 2+2-3 1 
de ES — — 
1 vev 4+1+1 6 

wv ç 0+2+3 5 
Gà = = = 
? vev 0+1+1 2 

WV 1-2+3 2 
Ca = =. = 
> we 1+1+1 3 


Por tanto, 


Z =, 1 5 2 
W = OVi + CV + GV = gV + 3V2 + 3V 


(Compruebe esto.) Con la notación introducida en la sección 3.5, también puede escri- 
bir la ecuación anterior como 


[w]y = 


WIN nia DOI= 


i 


Compare el procedimiento del ejemplo 5.4 con el trabajo requerido para encontrar 
directamente estas coordenadas y comience a apreciar el valor de las bases ortogonales. 

Como se anotó al comienzo de esta sección, la otra propiedad de la base estándar en 
R” es que cada vector de base estándar es un vector unitario. Al combinar esta propiedad 
con la ortogonalidad, se tiene la siguiente definición. 


Definición Un conjunto de vectores en R” es un conjunto ortonormal si es un 
conjunto ortogonal de vectores unitarios. Una base ortonormal para un subespacio 
W de R” es una base de W que es un conjunto ortonormal. 


Comentario SiS = {q;,..., q} es un conjunto ortonormal de vectores, entonces 
q; q; = 0 para ¡7% jy||q;| = 1. El hecho de que cada q; es un vector unitario es equivalente 
a q;* q; = 1. Se tiene que es posible resumir el enunciado de que S es ortonormal como 


_ JO sir*j 
EYU sii=j 


Demuestre que S = [q;, q,) es un conjunto ortonormal en R? si 


1/V3 1/V6 
q=|-1/4| y q=|2/v6 
1/V3 1/V6 
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Solución Compruebe que 
q, +9 = 1/V18 — 2/V18 + 1/V18 = 0 
q9:q9 = 1/3 + 1/3 + 1/3 = 1 
q»: q = 1/6 + 4/6 + 1/6 = 1 


-i 


Si tiene un conjunto ortogonal, puede obtener fácilmente un conjunto ortonormal a 
partir de él: simplemente normalice cada vector. 


Construya una base ortonormal para R? a partir de los vectores del ejemplo 5.1. 


Solución Dado que ya se sabe que v}, v, y V, son una base ortogonal, normalícelos para 


obtener 
j | 2 2/V6 
` v= 1|=| 1/V6 
qı INAI 1 V6 / 
-1 -1/V6 
0 0 
> Lia 1/ V2 
_ e Z 
B l v a 
2 
i i 1 1/3 
= v; = 1|= 1/V3 
EA / 
1 UY 


Entonces {q; q» q,) es una base ortonormal para R°. 


a 


Dado que cualquier conjunto ortonormal de vectores es, en particular, ortogonal, 
entonces es linealmente independiente, por el Teorema 5.1. Si tiene una base ortonor- 
mal, el Teorema 5.2 se vuelve todavía más simple. 


Teorema 5.3 


Sea {q;; q» - - - > q,) una base ortonormal para un subespacio W de R” y sea w cual- 
quier vector en W. Entonces 


w = (w-q,)q, + (w-q,)q, +: + (w-q;)9; 


y esta representación es única. 


Demostración Aplique el Teorema 5.2 y use el hecho de que q,*q,= 1 parai=1,...,k. 
— A 


Las matrices cuyas columnas forman un conjunto ortonormal surgen frecuentemente 
en las aplicaciones, como verá en la sección 5.5. Tales matrices tienen muchas propieda- 
des atractivas, que se examinan a continuación. 
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Teorema 5.4 


Matriz ortogonal es una desafortu- 
nada expresión terminológica. 
“Matriz ortonormal” sería clara- 
mente un mejor término, pero no 
es de uso común. Más aún, no 
existe un término para una matriz 
no cuadrada con columnas orto- 
normales. 


Las columnas de una matriz Q de m X n forman un conjunto ortonormal si y sólo si 


003 


Demostración Fs necesario demostrar que 


0 si1%j 
1 sii=j 


(00); = | 


Sea q; que denota la ¡-ésima columna de Q (y, en consecuencia, el i-ésimo renglón de 
Q”). Dado que la entrada (i, j) de QQ es el producto punto del ¡-ésimo renglón de Q” y 
la ¡-ésima columna de Q, se tiene que 


(QTQ); = Q;* 9; (2) 


por la definición de multiplicación de matrices. 


Ahora las columnas Q forman un conjunto ortonormal si y sólo si 


fo siisj 
EGU ii] 


lo que, por la ecuación (2), se cumple si y sólo si 
0 sii#j 

T o. = 
(Q Q); f sii=j 


Esto completa la demostración. _ 3 


Si la matriz Q en el Teorema 5.4 es cuadrada, tiene un nombre especial. 


Definición Una matriz Q de n X n cuyas columnas forman un conjunto orto- 
normal se llama matriz ortogonal. 


El hecho más importante acerca de las matrices ortogonales está dado por el si- 
guiente teorema. 


Teorema 5.5 


Una matriz cuadrada Q es ortogonal si y sólo si Q* = Q". 


Demostración Por el Teorema 5.4, Q es ortogonal si y sólo si Q'Q = I. Esto es verdadero 
si y sólo Q es invertible y Q7! = Q", por el Teorema 3.13. — 


> 


Ejemplo 5.7 


Demuestre que las siguientes matrices son ortogonales y encuentre sus inversas: 


cos —sen s 


0 1 0 
A=|0 0 1 B= 
y ja cos 
1 0 0 


Solución Las columnas de A son justo los vectores base estándar para R?, que claramente 
son ortonormales. Por tanto, A es ortogonal y 


0 
A sA =|1 
0 


=. O oO 
O O j= 
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La palabra ¡sometría significa lite- 
ralmente “conservación de longi- 
tud”, pues se deriva de las raíces 

. pa 
griegas isos (“igual”) y metron 
(“medida”). 


Para B, se comprueba directamente que 


pip= | cos O e] Pra heal 
—senÚO  cos0||sen0 cos 0 
a cos” 0 + sen? 0 A] a J= 
—sen O cos O + cos O sen 0 sen? 0 + cos? 0 0 1 


Por tanto, B es ortogonal, por el Teorema 5.5, y 


cosÓ sen 4 


B` = B" = | 
—sen cos 


e: 


Comentario La matriz A del ejemplo 5.7 es un ejemplo de una matriz permutación, 
la cual se obtiene al permutar las columnas de una matriz identidad. En general, cual- 
quier matriz permutación de n X n es ortogonal (vea el ejercicio 25). La matriz B es la 
matriz de una rotación en un ángulo 0 en R?. Cualquier rotación tiene la propiedad de 
que es una transformación que conserva la longitud (que en geometría se conoce como 
isometría). El siguiente teorema muestra que toda transformación con matriz ortogonal 
es una isometría. Las matrices ortogonales también conservan los productos punto. De 
hecho, las matrices ortogonales se caracterizan por alguna de dichas propiedades. 


Teorema 5.6 


Sea Q una matriz de n X n. Los siguientes enunciados son equivalentes: 


a. Qes ortogonal. 
b. |Qxl| = ||x| para toda x en R”. 
c. Qx:-Qy=x:y para toda x y y en R”. 


Demostración Se demostrará que (a) = (c) = (b) = (a). Para hacerlo, será necesario 
usar el hecho de que, si x y y son vectores (columna) en R”, entonces x+ y = x"y. 
(a) => (c) Suponga que Q es ortogonal. Entonces QQ = I y se tiene 
Qr- Oy =(03)'Qy = 0 0y == Y =x:Y 
(c) => (b) Suponga que Qx: Qy = x: y para toda x y y en R”. Entonces, al tomar y = x, 
se tiene Qx: Qx = x: x, así |Qxl| = VQx: Qx = Vx- x = lx]. 
(b) = (a) Suponga que la propiedad (b) se cumple y sea q; la i-ésima columna de Q. Al 
usar el ejercicio 63 en la sección 1.2 y la propiedad (b), se tiene 
x+y = (lx + y]? — [lx — yl?) 

= (lE + yI? — RE — 15 

= (Qx + Qyl? — [Qx = Qyl?) 

= Qx Š Qy 


para toda x y y en R”. [Esto demuestra que (b) = (c).] 
Ahora, si e, es el i-ésimo vector de la base estándar, entonces q; = Qe,. En consecuencia, 
0 sii#j 
q;* q; = Qe;- Qe; = e,- e; a Da a 
sii=j 
Por tanto, las columnas de Q forman un conjunto ortonormal, de modo que Q es una 
matriz ortogonal. = 
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Al observar las matrices ortogonales A y B en el ejemplo 5.7, podrá notar que no sólo 
sus columnas forman conjuntos ortonormales, también lo hacen los renglones. De 
hecho, toda matriz ortogonal tiene esta propiedad, como lo muestra el siguiente teo- 
rema. 


Teorema 5.7 


Si Q es una matriz ortogonal, entonces sus renglones forman un conjunto ortonor- 
mal. 


Demostración Del Teorema 5.5 se sabe que Q7! = Q". Por tanto, 
(que = (qu = Q = (Que 
de modo que Q” es una matriz ortogonal. Por tanto, las columnas de Q”, que son los ren- 


glones de Q, forman un conjunto ortonormal. —— A 


El teorema final en esta sección menciona algunas otras propiedades de las matrices 
ortogonales. 


Teorema 5.8 


Ejercicios 9.1 


Sea Q una matriz ortogonal. 


Q`! es ortogonal. 

. det Q = +1 

Si A es un eigenvalor de Q, entonces |À| = 1. 

. Si Q, y Q, son matrices ortogonales de n X n, entonces también lo es Q,Q,. 


ango 


Demostración Se demostrará la propiedad (c) y las demostraciones de las propiedades 
restantes se dejarán como ejercicios. 


(c) Sea A un eigenvalor de Q con su correspondiente eigenvector v. Entonces Qv = Av 
y, por el Teorema 5.6(b), se tiene 


Ivi = Qv] = [av]! = Jlli 


Dado que ||v|| + 0, esto implica que [A] = 1. — 


Comentario La propiedad (c) se cumple incluso para eigenvalores complejos. La 


f =1 ; AEE f 
matriz | i l es ortogonal con eigenvalores i y —i, que tienen valor absoluto 1. 


Y 


En los ejercicios 1-6, determine cuáles conjuntos de vectores 2 =2 —4 
son ortogonales. 1 =6 
-3] f2 1 4] [1] fa la ra a 
1.| 1|, 14 |-1 2 2 lol! 4 0 
21 L1 2 =2 | |2 1 ran A 
3| [1 2 1 i -2 cr? 1 1| |- 
3.| 1 2|,|-2| 4. |2|.| 1h] 6 1P opjifpf ıı 
=1 1 4 3 -2 =] -1 -1 0 1 
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En los ejercicios 7-10, demuestre que los vectores dados forman 1 0 0 1/V6 
una base ortogonal para R? o R°. Luego use el Teorema 5.2 0 2/3 1/V2 1/V6 
para expresar w como una combinación lineal de dichos vecto- 21. 0 -2/3 1/V2 -1/V6 
res base. Proporcione el vector coordenada [w] z de w con res- 

pecto a la base B = [v,, v,} de R? o B = Lv,, v,, v3} de RÈ. 0. 14 0 1/v2 


4 i i 22. Demuestre el Teorema 5.8(a). 
7.v, = | | v= Al w= | | 23. Demuestre el Teorema 5.8(b). 


-2 3 24. Demuestre el Teorema 5.8(d). 
3 ó j 25. Demuestre que toda matriz permutación es ortogonal. 
8. v, = | | v | l = | | 26. Si Q es una matriz ortogonal, demuestre que cualquier 
1 6 2 a . 
matriz obtenida al reordenar los renglones de Q tam- 
1 1 1 1 bién es ortogonal. 
9. v = 0 |, v 2 l, v -1 l;w=]1 27. Sea Q una matriz ortogonal de 2 X 2 y sean x y y vecto- 
-1 1 1 1 res en R?. Si 0 es el ángulo entre X y y, demuestre que el 
ángulo entre Qx y Qy también es 6. (Esto demuestra 
1 J 0 1 que las transformaciones lineales definidas por matrices 
10.v,=|1|w,=|-1|v= 1 li:w=|2 ortogonales conservan el ángulo en R?, un hecho que es 
1 1 -i 3 verdadero en general.) 
28. (a) Demuestre que una matriz ortogonal de 2 X 2 debe 
En los ejercicios 11-15, determine si el conjunto ortogonal de tener la forma 
vectores dado es ortonormal. Si no lo es, normalice los vectores 
para formar un conjunto ortonormal. f =] ð k | 
b a b —a 


E 


uve uw 


a dio 
donde H es un vector unitario. 


2. 2 For 4 
3 3 1 1 1 al 
13.124, |,| 2 14 all i (b) Al usar el inciso (a), demuestre que toda matriz or- 
2 5 3 3 6 togonal de 2 X 2 es de la forma 
3 0 =2 1 1 _l 
2 3 6 
1/2 0 V3/2 0 | ar —sen s E | sen s 
a 1/2 V6/3 3/6 0 sen cos sen cos 
| =19 | 1/V6 P | vV3/6 | | 1/72 donde 0 = 8 < 27. 
1/2 —1/V6 =vV3/6] L1/V2 (c) Demuestre que toda matriz ortogonal de 2 X 2 co- 
rresponde a una rotación o a una reflexión en R’. 
En los ejercicios 16-21, determine si la matriz dada es ortogo- (d) Demuestre que una matriz Q ortogonal de 2 X 2 
nal. Si lo es, encuentre su inversa. corresponde a una rotación en R? sidet Q= 1 ya 
. 1 | 1/V2 a una reflexión en R? si det Q = —1. 
E =1/V2 1/2 
2 35 En los ejercicios 29-32, use el ejercicio 28 para determinar si la 
e matriz ortogonal dada representa una rotación o una refle- 
-} 0 ż xión. Si es una rotación, proporcione el ángulo de rotación; si 
A =os sën ó es una reflexión, proporcione la recta de reflexión. 
cos” 0 sen ð —cos 0 sen O ouy EY | -1/2 deta 
sen 0 sð 1/ V2 1/72 -vV3/2 -1/2 
a w a E E 
- vV3/2 12 4 2 


nie ie nie 
NIT Ni nia al 
ia nia nia nia 
Ni la nia nia 


| 


33. Sean A y B matrices ortogonales de n X n. 
(a) Demuestre que A(A" + BB = A + B. 


(b) Use el inciso (a) para demostrar que, si det A + 
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mal para R” con un primer vector x prescrito, una construc- 
ción que frecuentemente es útil en aplicaciones.) 


35. Demuestre que, si una matriz triangular superior es or- 
togonal, entonces debe ser una matriz diagonal. 


det B = 0, entonces A + B no es invertible. 36. Demuestre que, si n > m, entonces no hay una matriz A 


34. Sea x un vector unitario en R”. Particione x como de m X n tal que [Ax] = |x|] para toda x en R”. 
Xx 37. Sea B = {v,, ..., v,) una base ortonormal para R”. 
ESE 
E e | y | (a) Demuestre que, para cualquier x y y en R”, 
Xy xy = (xev) yey) + Eva) yev) + + 
Sea + (Xiv, )(Y Vn) 
ES E Y A (Esta identidad se llama Identidad de Parseval.) 
Q= E 1 r (b) ¿Qué implica la Identidad de Parseval acerca de la 
Y: de ( 1- x Jy relación entre los productos punto x + y y [x] z * 
ly] 


Demuestre que Q es ortogonal. (Este procedimiento propor- 
ciona un método rápido para encontrar una base ortonor- 


nan Complementos y proyecciones ortogonales 

En esta sección se generaliza dos conceptos que se encontraron en el capítulo 1. La no- 
ción de un vector normal a un plano se extenderá a complementos ortogonales y la pro- 
yección de un vector sobre otro dará lugar al concepto de proyección ortogonal sobre un 
subespacio. 


de ca » 
W se pronunci i Complementos ortogonales 
Un vector normal n a un plano es ortogonal a todo vector en dicho plano. Si el plano 
pasa por el origen, entonces es un subespacio W de R’, como lo es gen(n). Por tanto, se 
> tienen dos subespacios de R° con la propiedad de que todo vector de uno es ortogonal a 
todo vector del otro. Esta es la idea detrás de la siguiente definición. 


W 
o Definición Sea W un subespacio de R”. Se dice que un vector v en R” es ortogo- 
nal a W si v es ortogonal a todo vector en W. El conjunto de todos los vectores que 
l son ortogonales a W se llama complemento ortogonal de W y se denota W*. Esto es, 
Figura 5.5 W+ = {ven R":v-w=0 para todo wen W} 


e=Wwżtyw=¢t 


| > 


Si W es un plano que pasa por el origen en R° y £ es la recta que pasa por el origen per- 
pendicular a W (esto es, paralela al vector normal a W), entonces todo vector v en £ es 
ortogonal a todo vector w en W; en consecuencia, € = W+. Más aún, W consiste precisa- 
mente de aquellos vectores w que son ortogonales a todo v en £; por tanto, también se 
tiene W = €+. La figura 5.5 ilustra esta situación. A 
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En el ejemplo 5.8, el complemento ortogonal de un subespacio evidencia ser otro 
subespacio. Además, el complemento del complemento de un subespacio es el subespa- 
cio original. Estas propiedades son verdaderas en general y se prueban como las propie- 
dades (a) y (b) del Teorema 5.9. Las propiedades (c) y (d) también serán útiles. (Re- 
cuerde que la intersección A N B de los conjuntos A y B consiste de sus elementos 
comunes. Vea el Apéndice A.) 


Teorema 5.9 


Sea W un subespacio de R”. 


a. W* es un subespacio de R”. 

b. (W3)* = W 

c WN W+ = {0} 

d. Si W = gen(w, . . ., w,), entonces v está en W* si y sólo si v - w, = 0 para todo 
t= lenok: 


Demostración (a) Dado que 0- w = 0 para todo w en W, 0 está en W+. Sean u y v que 
están en W* y sea c un escalar. Entonces 


uew=v:w=0(0 _ para todo wen W 


Por tanto, 


(u + v)-w=u:w+v:w=0+0=0 


de modo que u + v está en W”. 
También se tiene 


(cu) -w= c(u-w) =c(0) =0 


de donde se ve que cu está en W*. Se concluye que W+ es un subespacio de R”. 

(b) Esta propiedad se demostrará como el Corolario 5.12. 

(c) Se le pide demostrar esta propiedad en el ejercicio 23. 

(d) Se le pide demostrar esta propiedad en el ejercicio 24. —— 


Ahora puede expresar algunas relaciones fundamentales que involucran los subespa- 
cios asociados con una matriz de m X n. 


Teorema 5.10 


Sea A una matriz de m X n. Entonces el complemento ortogonal del espacio renglón 
de A es el espacio nulo de A y el complemento ortogonal del espacio columna de A es 
el espacio nulo de A”: 


(renglón(A))+ = nulo(A) y  (col(A))+ = nulo(A?) 


Demostración Six es un vector en R”, entonces x está en (renglón(A))* si y sólo si x es 
ortogonal a todo renglón de A. Pero esto es verdadero si y sólo si Ax = 0, lo cual equivale 
a que x está en nulo(A), de modo que se ha establecido la primera identidad. Para de- 
mostrar la segunda identidad, simplemente sustituya A por A” y use el hecho de que ren- 
glón(A* ) = col(A). — 


Por tanto, una matriz de m X n tiene cuatro subespacios: renglón(4), nulo(A), 
col(A) y nulo(A”). Los primeros dos son complementos ortogonales en R” y los últimos 
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nulo(A) nulo(A7) 


Ta 


renglón(A) col(A) 


R” R” 
Figura 5.6 


Los cuatro subespacios fundamentales 


dos son complementos ortogonales en R”. La matriz A m X n define una transforma- 
ción lineal de R” en R” cuyo rango es col(A). Más aún, esta transformación envía 
nulo(A) a 0 en R”. La figura 5.6 ilustra esquemáticamente estas ideas. Estos cuatro sub- 


espacios se llaman los subespacios fundamentales de la matriz A de m X n. 


Encuentre bases para los cuatro subespacios fundamentales de 


1 L 3 1 6 
2 =] 0 1. = 
A= 
=3 2. 1 =2 1 
4 6 1 3 


y verifique el Teorema 5.10. 


Solución En los ejemplos 3.45, 3.47 y 3.48, calcularon las bases para el espacio renglón, 
espacio columna y espacio nulo de A. Se encontró que renglón(A) = gen(u,, u, uy), 
donde 


a =[1 0 1 0 =1). w=[0 1 2 0 3}, u=[0 0 0 1 4# 


Además, nulo(A) = gen(x,, x,), donde 


=1 1 

=2 =3 

X = ll x= 0 
0 —4 

0 1 


Para demostrar (renglón(A))* = nulo(A), es suficiente demostrar que todo u; es orto- 


»—>  gonal a cada x; lo cual es un ejercicio sencillo. (¿Por qué esto es suficiente?) 
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El espacio columna de A es col(4) = gen(a,, a, az), donde 


1 1 
2 5] 1 
ld A A 
4 1 


1 2 -3 4/0 1.0.0 1[0 
l1 =1 2 1/0 0 1 0 60 
[a"|0]=]|3 0 1 6ljo|—>]|0 O 1 3]|0 
1 E =2 TO 0 0 0 0j0 
6 =] 1 3]0 0 0 0 0/0 
De este modo, si y está en el espacio nulo de A’, entonces y, = —yp Y, = — 6y, Y y; = 
—3y,. Se tiene que 
me =l 
—=6 —6 
nulo(A") = E = gen 
—3y, =3 
Ya 1 
y es fácil comprobar que este vector es ortogonal a a,, a, y a. 


El método del ejemplo 5.9 se adapta con facilidad a otras situaciones. 


Ejemplo 5.10 Sea W el subespacio de R* generado por 


=] 0 

= 1 =] 

w= ť> W= 2 |, w= 4 
=2 =] 

5 3 5 


Encuentre una base para W+. 


Solución El subespacio W generado por w,, w, y w; es lo mismo que el espacio co- 


lumna de 
1 -=i 0 
=3 1 si 
A= 2 4 
0. =2 l 


proyu(v) 


Figura 5.7 
v = proy,(v) + perp,(v) 
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En consecuencia, por el Teorema 5.10, W+ = (col(4))* = nulo(4*) y puede proceder 
como en el ejemplo anterior. Calcule 


L =3 3 0 5/0 0 0 3 40 
[A"]o]=|-1 1 2 -2 3[0|—>|0 1 0 1 3]0 
0 -1 4 =t 5]|0 0.00 1 0 2]0 
Por tanto, y está en W* si y sólo si y, = —3y, — 4Y5 Y, = — y4 — 3Y; Y Y = —2y;. Se tiene 
que 
=3y, — 4y5 =3||-4 
=y, — 375 =1]||-3 
wt = — 2y; = gen 0 || -2 
Ya 1 0 
Ys 0 1 


y estos dos vectores forman una base para W+. 


Proyecciones ortogonales 


Recuerde que, en R?, la proyección de un vector v sobre un vector distinto de cero u está 
y 


dada por 
u-v 
proyu(v) = (E), 


Más aún, el vector perp,(v) = v — proy, (v) es ortogonal a proy,(v), y v puede descom- 
ponerse como 
V = proyu(v) + perpu(v) 
como se muestra en la figura 5.7. 
Si se hace W = gen(u), entonces w = proy, (v) está en W y w+ = perp,(v) está en 
W+. En consecuencia, se tiene una forma de “descomponer” v en la suma de dos vecto- 


res, uno de W y el otro ortogonal a W; a saber, v = w + w+. Ahora esta idea se genera- 
liza a R”. 


Definición Sea Wun subespacio de R" y sea [u.,...,u,) una base ortogonal para 
W. Para cualquier vector v en R”, la proyección ortogonal de v sobre W se define 


como 
U y uv 
rOyy(v) = Uj tot u 
proyukv) E i E < 


El componente ortogonal de v a W es el vector 


perpyw(v) = v — proyy(v) 


Cada sumando en la definición de proyyy(v) también es una proyección sobre un 
solo vector (o, de manera equivalente, el subespacio unidimensional generado por él; en 
el sentido anterior). Por tanto, con la notación de la definición anterior, puede escribir 


proyyw(v) = proyy(v) +: + proyy(v) 
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Figura 5.8 
P =P: +P 


Dado que los vectores u; son ortogonales, la proyección ortogonal de v sobre W es la 
suma de sus proyecciones sobre subespacios unidimensionales que son mutuamente orto- 
gonales. La figura 5.8 ilustra esta situación con W = gen(u,, u,), p = proyy(v), p, = 
proy,, (Y) y P, = Proy, (V). 

Como un caso especial de la definición de proy,y(v), ahora también se tiene una ami- 
gable interpretación geométrica del Teorema 5.2. En términos de la notación y termino- 
logía actuales, dicho teorema afirma que si w está en el subespacio W de R”, que tiene 
base ortogonal {v}, V» ..., Vp} entonces 


W-v; W-V 
w= haa a Vi 
viv MAL 


= proy, (w) +: + proy, (w) 


Por tanto, w se descompone en una suma de proyecciones ortogonales sobre subespacios 
unidimensionales mutuamente ortogonales de W. 

La definición anterior parece depender de la elección de la base ortogonal; esto es, 
una base diferente ([u;,..., u,) para W parecería producir “diferentes” proy,y(v) y 
perp y (v). Por fortuna, este no es el caso, como pronto se probará. Por ahora, confor- 
mese con un ejemplo. 


> 
Ejemplo 5.11 3 
Sea W el plano en R? con ecuación x — y + 2z = 0 y sea v = | —1 |. Encuentre la pro- 
2 


yección ortogonal de v sobre W y el componente ortogonal de va W. 


Solución En el ejemplo 5.3 se encontró una base ortogonal para W. Considere 


1 =] 

u=|l y S= 1 

0 1 

se tiene u:v=2 u-v=-2 
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En consecuencia, 


1 1 5 
=41ļ|-4 1|=| 3 
0 1 2 
3 3 4 
y perpyw(v) = v — proyy(y) =| -1| -| 3|=|-=3 
2 => 8 
3 3 


Es fácil ver que proyw (v) está en W, pues satisface la ecuación del plano. Igualmente, 
es fácil ver que perp y (V) es ortogonal a W, pues es un múltiplo escalar del vector normal 
1 
—1 | a W. (Vea la figura 5.9.) 
2 


perpy(v) 


Figura 5.9 
v = proy¡y(v) + perpyy(v) 


El siguiente teorema muestra que siempre es posible encontrar una descomposición 
de un vector con respecto a un subespacio y su complemento ortogonal. 


Teorema 5.11 Fl teorema de descomposición ortogonal 
Sea W un subespacio de R” y sea v un vector en R”. Entonces existen vectores únicos 
wen W y w* en WH tales que 


v=w+wt 


Demostración Es necesario demostrar dos cosas: que tal descomposición existe y que es 
única. 

Para demostrar su existencia se elige una base ortogonal {u}, . . . , u,) para W. Sea 
w = proyw (v) y sea w+ = perpw (v). Entonces 


w + wt = proyy(v) + perpy(v) = proyw(v) + (v — proyw(v)) = v 
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Claramente, w = proyw (v) está en W, pues es una combinación lineal de los vectores 
base u; . . . , u, Para demostrar que w+ está en W+, es suficiente demostrar que w* es or- 
togonal a cada uno de los vectores base u, por el Teorema 5.9(d). Calcule 


u; w` = u; perpy(v) 


= u;: (v — proyw(v)) 


u’ vV uz’ V 
= u* vV u Ene ug 
u ° U; u’ Uk 


uv uv 
=u:v-— (a) A (ta) — 


| 
£ 
< 
o 
AE 
£ 
=< 
Sir 
£ 
£ 
| 
| 
o 


=u:v-u:v=0 


pues u; + u; = 0 para j% 1. Esto prueba que w+ está en W+ y completa la parte de la de- 
mostración relativa a la existencia. 

Para demostrar la unicidad de esta descomposición, suponga que tiene otra descom- 
posición v = w, + wi, donde w; está en Wy w+ está en W+. Entonces w + w+ = w, + wj, 
de modo que 


w-w=w -w 


Pero, dado que w — w; está en W y wt — wt está en W+ (porque son subespacios), se 
sabe que este vector común está en W N W+ = {0} [por el Teorema 5.9(c)]. Por ende, 


w-w=w -w =0 
4 z= L = 
así que w, = Wy W] = W.. — 


El ejemplo 5.11 ilustró el teorema de descomposición ortogonal. Cuando W es el 
subespacio de R? dado por el plano con ecuación x — y + 2z = 0, la descomposición 
3 
ortogonal de v = | —1 | con respecto a W es v = w + w*, donde 
2 


wio wie we 


w = proyw(v) = y w° = perpw(v) = 


WIN w= wu 


La unicidad de la descomposición ortogonal garantiza que las definiciones de 
proyw (v) y perpw (v) no dependan de la elección de la base ortogonal. El teorema de des- 
composición ortogonal también permite probar la propiedad (b) del Teorema 5.9. Aquí, 
dicha propiedad se enuncia como un corolario al teorema de descomposición ortogonal. 


Corolario 5.12 


Si W es un subespacio de R”, entonces 


(WEE = w 
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Demostración Si w está en W y x está en W+, entonces w+ x = 0. Pero ahora esto im- 
plica que w está en (W*)*. En consecuencia, W C (W*)*. Para ver que en realidad aquí 
se tiene una igualdad, suponga lo contrario. Entonces existe un vector v en (W*)* que 
no está en W. Por el Teorema 5.11, se puede escribir v = w + w* para vectores (únicos) 
wen W y w* en W+. Pero ahora 


0= vw = (w + wt) ewt = wewt + wewt =0 +w -wt = ww 
de modo que w* = 0. Por tanto, v = w + w+ = w y en consecuencia v está en W, lo que 


es una contradicción. Se concluye que (W+)+ = W, como se requería. — A 


También existe una buena relación entre las dimensiones de W y W”, expresada en el 
Teorema 5.13. 


Teorema 5.13 


Si W es un subespacio de R”, entonces 


dim W + dim WŁ = n 


Demostración Sea (u,,..., dim u,) una base ortogonal para W y sea {v}, . . . , Vi} una 
base ortogonal para W+. Entonces dim W = k y dim W* = l. Sea B = [u,..., Up 
Vp . + «> V}. Se afirma que B es una base ortogonal para R”. 


Primero note que, dado que cada u; está en W y cada v; está en w+, 
u; v;=0 para ¡= loses kyj = heel 


Por tanto, B es un conjunto ortogonal y, en consecuencia, es linealmente independiente, 
por el Teorema 5.1. A continuación, si v es un vector en R”, el teorema de descomposi- 
ción ortogonal dice que v = w + w* para algún w en Wy w+ en W+. Dado que w puede 
escribirse como una combinación lineal de los vectores u; y w+ puede escribirse como 
una combinación lineal de los vectores v;, v puede escribirse como una combinación li- 
neal de los vectores en B. Por tanto, B también genera a R” y por tanto es una base para 
R”. Se tiene que k + I = dim R”, o 


dim W + dim W+ = n — 
Como bono adorable, cuando este resultado se aplica a los subespacios fundamenta- 


les de una matriz, se obtiene una demostración rápida del teorema del rank (Teorema 
3.26), parafraseado aquí como Corolario 5.14. 


Corolario 5.14 


El teorema del rank 


Si A es una matriz de m X n, entonces 
rank(A) + nulidad(A) = n 


Demostración En el Teorema 5.13, tome W = renglón(A). Entonces W+ = nulo(A), 
por el Teorema 5.10, de modo que dim W = rank(A) y dim W+ = nulidad(A). El resul- 
tado viene a continuación. — 


Note que se obtiene una identidad contrapuesta al tomar W = col(A4) [y por tanto 
W- = nulo(A” )]: 


rank(A) + nulidad(A?) = m 
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Las secciones 5.1 y 5.2 ilustraron algunas de las ventajas de trabajar con bases orto- 
gonales. Sin embargo, no se estableció que todo subespacio tiene una base ortogonal, ni 
se proporcionó un método para construir tal base (excepto en casos particulares, como 
el ejemplo 5.3). Estos temas son la materia de la siguiente sección. 


|Hercicios 5.2 a 


En los ejercicios 1-6, encuentre el complemento ortogonal W* En los ejercicios 11-14, sea W el subespacio generado por los 
de W y proporcione una base para W+. vectores dados. Encuentre una base para W+. 
x 
L w= {f*|:x-y=0} 2 4 
y 1.w =| 1w =]l0 
a x =2 1 
2. W= ¿| ES o) 
$ 1 0 
sl =l 1 
3. W= yix ty=z= 12. w, = 1 W = 2 
Z 1 3 
X 
4. W= y |:-x + 3y- 5z=0 2 E 2 
=i 2 5 
z 13. w, = W = ,W, = 
pa 6 =3 6 
5. W = y |:ix=ty=->—tz=3t 3 =2 1 
z 3 1 3 
2 2 -2 
gWel yha 14.w =| 0hpw=|-2pw 5| 6 
f 2 -1 0 =} 
4 1 5 


En los ejercicios 7 y 8, encuentre bases para el espacio renglón 
y el espacio nulo de A. Verifique que todo vector en renglón(A) 


En los ejercicios 15-18, encuentre la proyección ortogonal de v 
es ortogonal a todo vector en nulo(A). i j proy S 


sobre el subespacio W generado por los vectores u;. (Puede su- 


O 3 poner que los vectores u; son ortogonales. ) 
5 2 1 
7.A = 7 1 
o LA is.v=| | | 
-1 -1 1 -4 l 
1 1 0d =1 1 1 1 
=2 Y 4 0 2 l6.v=|2| 4 =|1/|u=|- 
8.4 = 
Ze =Z 3 1 3 1 0 
2 4 2 9 1 1 2 =1 
17.v=]|2|,u =| —2 |, u = 1 
. de . 3 1 4 
En los ejercicios 9 y 10, encuentre bases para el espacio co- 
lumna de A y el espacio nulo de A” para el ejercicio dado. Ve- 4 1 0 -1 
rifique que todo vector en col(A) es ortogonal a todo vector en =2 1 E a _] 0 
p 18. v = uy = > U) > U; = 
nulo(A`). -3 0 1 1 
9. Ejercicio 7 10. Ejercicio 8 2 1 -1 1 
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En los ejercicios 19-22, encuentre la descomposición ortogonal 
de v con respecto a W. 


19. 


20. 


21. 


22. 


23. 
24. 
25. 


2 1 
v=[ahw= (l) 
=2 3 
4 
v= | -2 |, W= gen 2 
3 1 
4 1 1 
v=|-2|,W= gen 2 |, | =1 
3 1 1 
2 1 0 
1 =] 1 
v= , W = gen A 
5 1 1 
3 0 1 
Demuestre el Teorema 5.9(c). 


Demuestre el Teorema 5.9(d). 


Sea W un subespacio de R” y v un vector en R”. Su- 
ponga que w y w' son vectores ortogonales con w en W 
y que v = w + w”. ¿Es necesariamente cierto que w’ está 


m m 2 


26. 


en W*? Demuestre que es verdadero o encuentre un 
contraejemplo. 


Sea {v}, . . . , v,) una base ortogonal para R” y sea W = 
gen(v,, ...., Vi). ¿Es necesariamente cierto que W+ = 
gen (Vip -+ -> Vp)? Demuestre que es verdadero o en- 


cuentre un contraejemplo. 


En los ejercicios 27-29, sea W un subespacio de R" y sea x un 
vector en IR”. 


27. 
28. 


Demuestre que x está en W si y sólo si proyy(x) = x. 


Demuestre que x es ortogonal a W si y sólo si proy y (Xx) 
=0. 


. Demuestre que proyy(proy,y(x)) = proy¡y(X). 
. Sea S = ([v,,. 


. . » Vp} un conjunto ortogonal en R” y sea 
x un vector en R”. 
(a) Demuestre que 


[xP = por? + po va? + 0 + po ve 
(Esta desigualdad se llama desigualdad de Bessel.) 


(b) Demuestre que la desigualdad de Bessel es una 
igualdad si y sólo si x está en gen(S). 


El proceso de Gram-Schmidt 
y la factorización QR 


En esta sección se presenta un método simple para construir una base ortogonal (u or- 
tonormal) para cualquier subespacio de R”. Este método conducirá entonces a una de las 
más útiles de todas las factorizaciones de matrices. 


Se pide encontrar una base ortogonal para un subespacio W de R”. La idea es comenzar 


con una base arbitraria (X,,... 


, X,) para W y “ortogonalizarla” de vector en vector. La 


construcción básica se ilustrará con el subespacio W del ejemplo 5.3. 


Ejemplo 5.12 


Sea W = gen(x,, x, ), donde 


1 =2 
x=|l y X= 0 
0 1 


Construya una base ortogonal para W. 


Solución A partir de x}, se obtiene un segundo vector que es ortogonal a él al tomar el 
componente ortogonal de x, a x, (figura 5.10). 
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— $ xa 
Proyy (X2) LT 
Ww 
Xi 
Figura 5.10 
Construcción de v, ortogonal a x, 
Algebraicamente, se establece v, = x,, de modo que 
V2 = perpx (2) = X, — proy„ (x2) 
E xXx 
=% xx Xx 
=2 1 =1 
=2 
= 0j = (2) 1| = 1 
2 
1 0 1 


Entonces {v,, v,) es un conjunto ortogonal de vectores en W. Por tanto, {v}, v,) es un 
conjunto linealmente independiente y en consecuencia una base para W, pues 


dim W = 2. | 


Comentario Observe que este método depende del orden de los vectores base origi- 
=2 1 
0|yx 1 |, habría obtenido 
1 0 


nales. En el ejemplo 5.12, si hubiera tomado x, = 


una base ortogonal diferente para W. (Verifique esto.) 

La generalización de este método a más de dos vectores comienza como en el ejem- 
plo 5.12. Entonces el proceso es construir de manera iterativa los componentes ortogo- 
nales de los vectores subsecuentes a todos los vectores que ya se construyeron. El método 
se conoce como proceso de Gram-Schmidt. 


Teorema 5.15 


El proceso de Gram-Schmidt 


Sea {X}, . . . , X,) una base para un subespacio W de R” y defina lo siguiente: 


v =X, W, = gen(x,) 


W, = gen(x;, x2) 


X; 


e do W; = gen(x;, X» X3) 


( Vk-1 ° Xk » 
T k-Db 
Vk-1 * Vk-1 


Entonces, para cada i = 1,...,k,[v,,..., V;} es una base ortogonal para W, En par- 
ticular, [v,, ....., v,) es una base ortogonal para W. 


W, = gen(x,,...,X;) 


Jórgen Pedersen Gram (1850- 
1916) fue un actuario (estadístico 
de seguros) danés que estaba inte- 
resado en la ciencia de la medi- 
ción. Primero publicó el proceso 
que lleva su nombre en un ensayo 
de 1883 acerca de mínimos cua- 
drados. 

Erhard Schmidt (1876-1959) fue 
un matemático alemán discípulo 
del gran David Hilbert y es consi- 
derado uno de los fundadores de la 
rama de las matemáticas conocida 
como análisis funcional. Su apor- 
tación al proceso Gram-Schmidt 
se produjo en un ensayo de 1907 
acerca de ecuaciones integrales, en 
el que escribió los detalles del mé- 
todo de manera más explícita que 
Gram. 
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Dicho de manera sucinta, el Teorema 5.15 dice que todo subespacio de R” tiene una 
base ortogonal y proporciona un algoritmo para construir dicha base. 
Demostración Se probará por inducción que, para cada i = 1,...,k,[v,,..., V;} es una 
base ortogonal para W. 

Dado que v, = x,, claramente [v,) es una base (ortogonal) para W, = gen(x;). Ahora 
suponga que, para algún i < k, {v}, . . . , v;) es una base ortogonal para W,. Entonces 


di Vit Xiti ” V2 * Xi+1 n MIES! v 
i+1 i+1 1 2 i 
' i vis Vi vV’ Vi? Vi i 


, V;} es una base ortogonal para gen(x,, ... 


Por la hipótesis de inducción, {v}, .... ,X) = 


W;. En consecuencia, 
Vii 5 Xi41 T proyw(X;+1) = perpy(X;+1) 


De modo que, por el Teorema de Descomposición Ortogonal, v,, es ortogonal a W,. Por 
definición, V}, . . . , v; son combinaciones lineales de x,, . . . , x; y, en consecuencia, están 
en W,. Por tanto, {V}, . . - , V;,,) es un conjunto ortogonal de vectores en W,- 

Más aún, v;, 0, pues de otro modo, x;,, = Proyyy(X;, 1), que a su vez implica que x;,; 
está en W, Pero esto es imposible, pues W, = gen(x,,...,xX;) y [X,...,X;,,) es linealmente 
independiente. (¿Por qué?) Se concluye que [v,,...., v;,,) es un conjunto de ¡+ 1 vectores 
linealmente independientes en W,,,. En consecuencia, [v,,...., V;,,) es una base para W;,,, 
pues dim W,,, = i + 1. Esto completa la demostración. — 


Si requiere una base ortonormal para W, simplemente necesita normalizar los vecto- 
res ortogonales producidos por el proceso de Gram-Schmidt. Esto es, para cada i, susti- 


tuya v; por el vector unitario q; = (1/||v;|| )v;- 


> 


Ejemplo 5.13 


Aplique el proceso de Gram-Schmidt para construir una base ortonormal para el subes- 
pacio W = gen(x,, X», x,) de R4, donde 


1 2 2 

-1 1 2 
Aa Aa A 
1 1 2 


Solución Primero note que {Xx}, X, X;} es un conjunto linealmente independiente, de 
modo que forma una base para W. Comience por establecer v, = x,. A continuación, 
calcule el componente ortogonal de x, a W, = gen(v,): 


Vx 
X= Vi 
vie V 


v, = perpw (x2) 


2 1 
1 a| 1 
= l-o 2 
1 1 


Nise nj NIY nu 


402 Capítulo 5 Ortogonalidad 


Para cálculos a mano, es buena idea “escalar” v, en este punto para eliminar fracciones. 
Cuando termine, puede reescalar el conjunto ortogonal que construyó para obtener un 
conjunto ortonormal; por tanto, puede sustituir cada v, por cualquier múltiplo escalar 
conveniente sin afectar el resultado final. En concordancia, sustituya v, por 


3 


f — 
v, = wv, = 


= Ww 


1 
Ahora encuentre el componente ortogonal de x, a 
W, = gen (xp X2) = gen (vp v2) = gen (vi, v) 


usando la base ortogonal {v}, v3}: 


MIES 
Vy= perpw (x) =X Vi 


vev 
2 1 3 
2 =il 3 
=| l-o 1-8, 
2 1 1 
=! 
2 
o 0 
= 1 
2 
1 
=1 
0 
De nuevo, reescale y use v} = 2v, = j 
2 
»—> Ahora tiene una base ortogonal (v,, v}, v3) para W. (Compruebe para asegurarse de 


que dichos vectores son ortogonales.) Para obtener una base ortonormal, normalice 
cada vector: 


1 1/2 


a= (55) = (5) Er Ñ e 


1 1/2 
3 3/2V5 3V5/10 
( n) ( 1 ) 3|_|3/2V5|_ |3v5/10 
Ami? hvs lil |1245| | vs/10 
1 1125 V5/10 
-1 —1/V6 —vV6/6 
( 1 ) f ( 1 ) of 0 . 0 
BAI ve] 1| | yve |7] vas 
2 2/V6 V6/3 


Entonces (q, q, q,) es una base ortonormal para W. 


md 
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Uno de los usos importantes del proceso de Gram-Schmidt es construir una base or- 
togonal que contenga un vector especificado. El siguiente ejemplo ilustra esta aplicación. 


Ejemplo 5.14 


Encuentre una base ortogonal para R? que contiene al vector 
1 
v=|2 
3 


Solución Encuentre primero cualquier base para R? que contenga a v,. Si se toma 


0 0 
x=|l y Xx=|0 
0 1 


entonces {v}, X», X,) es claramente una base para R’. (¿Por qué?) Ahora aplique el proceso 
de Gram-Schmidt a esta base para obtener 


0 1 = -1 
— vi 2 5 r 
YX vi 1 (a) 2 7p %27 5 
vv dl 
0 3 =5 =3 
y finalmente 
) l 1 [5 
MISS Vox, = 
V3 = X; ( J ( 7 -) 0 (54) 2 (5) a > 
MIDA va" v 1 
3 =3 w 
=3 
v; = 0 
1 
Entonces [v,, v}, v3} es una base ortogonal para R? que contiene a v}. | 


De igual modo, dado un vector unitario, puede encontrar una base ortonormal que 
lo contenga usando el método anterior y luego normalizar los vectores ortogonales re- 
sultantes. 


Comentario Cuando se implementa el proceso de Gram-Schmidt en una compu- 
tadora, casi siempre existe cierto error de redondeo, lo que conduce a una pérdida de or- 
togonalidad en los vectores v, Para evitar esta pérdida de ortogonalidad, usualmente se 
hacen algunas modificaciones. Los vectores q; se normalizan tan pronto como se calcu- 
lan, en lugar de hacerlo al final, para obtener los vectores q, y, conforme se calcula cada 
q» los restantes vectores x; se modifican para ser ortogonales a q;. Este procedimiento se 
conoce como Proceso de Gram-Schmidt modificado. Sin embargo, en la práctica, se usa 
una versión de la factorización QR para calcular bases ortonormales. 


La factorización QR 


Si A es una matriz de m X n con columnas linealmente independientes (lo que requiere 
que m = n), entonces, la aplicación del proceso de Gram-Schmidt a dichas columnas 
produce una factorización de A muy útil que consiste en el producto de una matriz Q 
con columnas ortonormales y una matriz triangular superior R. Esta es la factorización 
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QR y tiene aplicaciones en la aproximación numérica de eigenvalores, lo que se explora 
al final de esta sección, y al problema de aproximación de mínimos cuadrados, que se 
discute en el capítulo 7. 

Para ver cómo surge la factorización QR, sean a}, . . . , a, las columnas (linealmente 
independientes) de A y sean q, .. ., q, los vectores ortonormales obtenidos al aplicar a 
la matriz A el proceso de Gram-Schmidt con normalizaciones. A partir del Teorema 5.15 
se sabe que, para cada i = 1,..., n, 


W; = gen(a,..., a) = gen(q;...> q;) 
Por tanto, existen escalares 1,;, fj- . . , r; tales que 
a; = fuqi + 13) +00 + 1,q¡parai=1,...,1 
Esto es: 
a = ruq 


a, = 11,1 + 72,9, 


n= finqı + Pana TEF Tanqn 


que puede escribirse en forma matricial como 


fir Tiz Pin 

0 r. ... Pon 
A=la a + al=[4 q cc ql. 2. 2 |=QR 

0 0 aii Tan 


Claramente, la matriz Q tiene columnas ortonormales. También es el caso en que las 
entradas diagonales de R son todas distintas de cero. Para ver esto, observe que si r; = 0, 


entonces a, es una combinación lineal de q4, . . . , q;—; Y, por tanto, está en W;,_,. Pero en- 
tonces a, sería una combinación lineal de a}, . . . , aj- lo que es imposible, pues a,,..., a; 
son linealmente independientes. Se concluye que r; 4 O para i = 1,...,n. Dado que R 


es triangular superior, debe ser invertible. (Vea el ejercicio 23.) 
Acaba de probarse el siguiente teorema. 


Teorema 5.16 


La factorización QR 


Sea A una matriz de m X n con columnas linealmente independientes. Entonces A 
puede factorizarse como A = QR, donde Q es una matriz de m X n con columnas or- 
tonormales y R es una matriz triangular superior invertible. 


Comentarios 

+ También puede hacer arreglos para que las entradas diagonales de R sean positi- 
vas. Si cualquier r; < 0, simplemente sustituya q; por —q; y r; por —r;,. 

+ FI requisito de que A tenga columnas linealmente independientes es necesario. 
Para probar esto, suponga que A es una matriz de m X n que tiene una factorización QR, 
como en el Teorema 5.16. Entonces, dado que R es invertible, se tiene Q = AR”! Por 
tanto, rango(Q) = rango(A), por el ejercicio 61 de la sección 3.5. Pero rango(Q) = n, 
pues sus columnas son ortonormales y, en consecuencia, linealmente independientes. 
De modo que rango(A) = n también, y en consecuencia las columnas de A son lineal- 
mente independientes por el teorema fundamental. 
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+ La factorización QR puede extenderse a matrices arbitrarias en una forma lige- 
ramente modificada. Si A es de m X n, se puede encontrar una secuencia de matrices or- 
togonales Q,,..., Q,,¡ tales que Q,,,*** Q,Q,A es una matriz triangular superior R de 
m X n. Entonces A = QR, donde Q = (Q,,_,*** QQ)! es una matriz ortogonal. Este 
planteamiento se examinará en la Exploración: “La factorización QR modificada”. 


Ejemplo 5.15 Encuentre una factorización QR de 
12.2 
= 1. 2 
A= 
=1 0 1 
1.1 2 


Solución Las columnas de A son justo los vectores del ejemplo 5.13. La base ortonor- 
mal para col(A) producida por el proceso de Gram-Schmidt fue 


1/2 3V5/10 -V6/6 

_ | —1/2 _ | 3V5/10 O 0 
t= ap P| vsp B| v66 
1/2 V5/10 V6/3 


de modo que 

1/2 3V5/10 —vV6/6 
-1/2 3vV5/10 0 
-1/2 vV5/10  vV6/6 
1/2 vV5/10  vV6/3 


Q=Í[q 9» q] T 


A partir del Teorema 5.16, A = QR para alguna matriz triangular superior R. Para 
encontrar R, use el hecho de que Q tiene columnas ortonormales y, en consecuencia, 
QTQ = I. Por tanto, 


QA = Q'QR=IR=R 


Calcule 
l 2-2 
1/2 =1/2 =1/⁄2 Y], 
R=Ql=|3vV5/10 3V5/10 v5/10 vV5/10 ee 
-vV6/6 0 Veoj6  V6/3 Le. 
2 1 1/2 
=|0 v5 3v5/2 
0 0  vV6/2 
Í Ejercicios 5.3 - 
En los ejercicios 1-4, los vectores dados forman una base para ofi [2 
R? o RÌ. Aplique el proceso de Gram-Schmidt para obtener 2x5 j p5] 
una base ortogonal. Luego normalice esta base para 
obtener una base ortonormal. 1 0 


3 

1 1 =|-— = = 
Lx =| El | 3. X; 11,x 3 1,x 2 
1 2 4 
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1 0 0 
4x=|1|x=|1|x=]/0 
1 1 1 


En los ejercicios 5 y 6, los vectores dados forman una base para 
un subespacio W de R? o R*. Aplique el proceso de Gram- 
Schmidt para obtener una base ortogonal para W. 


1 3 
5.Xx=|1|x=|4 
0 2 

1 1 1 

2 1 8 

| PA 

1 2 0 


En los ejercicios 7 y 8, encuentre la descomposición ortogonal 
de v con respecto al subespacio W. 


4 
7.v= | —4 |, W como en el ejercicio 5 
3 
1 
8. v= ; , W como en el ejercicio 6 
2 


Use el proceso de Gram-Schmidt para encontrar una base or- 
togonal para los espacios columna de las matrices en los ejerci- 
cios 9 y 10. 


1 2 -1 

0 1 1 10o 
9|1 0 1 10 it j 
1 1 0 11 5 


11. Encuentre una base ortogonal para R? que contenga al 
3 
vector | 1 
5 


12. Encuentre una base ortogonal para R* que contenga a 
los vectores 


2 1 
1 0 
0 y 3 

-1 2 


En los ejercicios 13 y 14, encuentre las entradas faltantes de Q 
para hacer Q una matriz ortogonal. 


1/V2 1/V3 * 
13.Q = 0 ya + 
-1/V2 1/V3 * 


1/2 HJv.u + + 
1/2 YY + + 
1/2 0 o 
1/2 —3/V14 + + 


14.Q = 


En los ejercicios 15 y 16, encuentre una factorización QR de la 
matriz en el ejercicio dado. 


15. Ejercicio 9 16. Ejercicio 10 


En los ejercicios 17 y 18, las columnas de Q se obtuvieron al 
aplicar el proceso de Gram-Schmidt a las columnas de A. En- 
cuentre la matriz triangular superior R tal que A = QR. 


2 8 2 53 5 
17.A=| 1 7 -1|1Q=]| 4 ł — 
-2 -2 1 -5353 3 
1 3 1/ V6 1/V3 

18. A = E ¿=> ave i 
-1 -1 -1/V6 1/V3 
0 1 0 1/V3 


19. Si A es una matriz ortogonal, encuentre una factoriza- 
ción QR de A. 

20. Demuestre que A es invertible si y sólo si A = QR, 
donde Q es ortogonal y R es triangular superior con 
entradas distintas de cero en su diagonal. 


En los ejercicios 21 y 22, use el método sugerido por el ejercicio 
20 para calcular A™' para la matriz A en el ejercicio dado. 


22. Ejercicio 15 


23. Sea A una matriz de m X n con columnas linealmente 
independientes. Proporcione una demostración alterna- 
tiva de que la matriz triangular superior R en una facto- 
rización QR de A debe ser invertible, usando la propie- 
dad (c) del teorema fundamental. 


21. Ejercicio 9 


24. Sea A una matriz de m X n con columnas linealmente 
independientes y sea A = QR una factorización QR 
de A. Demuestre que A y Q tienen el mismo espacio 
columna. 


ye. 
Figura 5.11 


X 


La factorización QR modificada 


Cuando la matriz A no tiene columnas linealmente independientes, el proceso de Gram- 
Schmidt no funciona en la forma que se planteó y por tanto no puede usarse para desa- 
rrollar una factorización QR generalizada de A. Existe una modificación del proceso de 
Gram-Schmidt que puede usarse, pero en vez de ello se explorará un método que con- 
vierte A en la forma triangular superior columna por columna, usando una secuencia de 
matrices ortogonales. El método es análogo al de la factorización LU, en el que la matriz L 
se forma usando una secuencia de matrices elementales. 

Lo primero que necesita es el “análogo ortogonal” de una matriz elemental; esto es, 
se necesita saber cómo construir una matriz ortogonal Q que transformará una columna 
dada de A, llámela x, en la correspondiente columna de R, llámela y. Por el Teorema 5.6 
será necesario que ||x|| = [Qx]| = |y]|. La figura 5.11 sugiere una forma de proceder: 
puede reflejar x en una recta perpendicular a x — y. Si 


ye T > Je y) = A 


da da ] : =d, 
es el vector unitario en la dirección de x — y, entonces u+ = | glS ortogonal a u y 
1 


puede usar el ejercicio 26 de la sección 3.6 para encontrar la matriz estándar Q de la re- 
flexión en la recta que pasa por el origen en la dirección de u+. 


T 


1 — 2d? l fed 
= — Z¿uu. 


1. Demuestre que Q = 
eng pe 1 — 2d; 


2. Calcule Q para 


o o- Eh-i 


Puede generalizar la definición de Q del modo siguiente. Si u es cualquier vector uni- 
tario en R”, una matriz Q de n X n se define como 


Q = I — 2uu" 
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Alston Householder (1904-1993) 
fue uno de los pioneros en el 
campo del álgebra lineal numérica. 
Fue el primero en presentar un tra- 
tamiento sistemático de los algorit- 
mos para resolver problemas que 
involucran sistemas lineales. Ade- 
más de introducir las ampliamente 
utilizadas transformaciones de 
Householder que llevan su nombre, 
fue uno de los primeros en defen- 
der el uso sistemático de normas en 
el álgebra lineal. Su libro de 1964, 
La teoría de matrices en el análisis 
numérico, es considerado un clá- 
sico. 
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Tal matriz se llama matriz de Householder (o un reflector elemental). 


3. Demuestre que toda matriz de Householder Q satisface las siguientes propieda- 
des: 


(a) Q es simétrica. (b) Q es ortogonal. (5) O04=/ 


4. Pruebe que si Q es una matriz de Householder correspondiente al vector unita- 
rio u, entonces 


—v siv está en gen(u) 
CS 
v siv:u=0 


1 
5. Calcule Q para u = | —1 | y verifique los problemas 3 y 4. 
2 


6. Seax% y con ||x|| = | yl y haga (1/ |x — y [)(x — y). Demuestre que la corres- 
pondiente matriz Q de Householder satisface Qx = y. [Sugerencia: aplique el ejercicio 57 
en la sección 1.2 al resultado del problema 4.] 


7. Encuentre Q y verifique el problema 6 para 
1 3 
x=|2 y y=]|0 
2 0 


Ahora está listo para realizar la triangularización de una matriz A de m X n, columna 
por columna. 


8. Sea x la primera columna de A y sea 


[xl 


0 
Demuestre que si Q, es la matriz de Householder dada por el problema 6, entonces Q,A 
es una matriz con la forma de bloque 


ES ES 
bag pl Al 


donde A, es (m — 1)X (n — 1). 
Si se repite el problema 8 en la matriz A,, use una matriz de Householder P, tal que 


E E 
P,A, = 
Aa] 
donde A, es (m — 2)X (n — 2). 


1 0 
9. Sea Q, = | | Demuestre que Q, es una matriz ortogonal y que 


0 P, 
E E 
QQá=[0 + + 
0 0 4 


10. Demuestre que puede continuar de esta forma para encontrar una sucesión de 
matrices ortogonales Q,,..., Q„— tales que Q,,_,*** Q,Q,A = R es una matriz triangu- 
lar superior de m X n (es decir, r; = 0 si i > j). 

11. Deduzca que A = QR con Q = QQ, `": Qn- ortogonal. 

12. Use el método de esta exploración para encontrar una factorización QR de 


1 2 3 2 


e wo 


4. 3 2 


| 


Vea G. H. Golub y C. F. Van 
Loan, Matrix Computations 
(Baltimore: Johns Hopkins 
University Press, 1983). 


Cómo aproximar eigenvalores 
con el algoritmo QR 


Uno de los mejores métodos (y más ampliamente usados) para aproximar numérica- 
mente los eigenvalores de una matriz, utiliza la factorización QR. El propósito de esta ex- 
ploración es introducir este método, el algoritmo QR, y demostrarlo en funcionamiento 
en algunos ejemplos. Para un tratamiento más completo de este tema, consulte cualquier 
buen libro de álgebra lineal numérica. (Encontrará útil usar un CAS para realizar los 
cálculos en los problemas siguientes.) 

Dada una matriz cuadrada A, el primer paso es factorizarla como A = QR (con cual- 
quier método adecuado). Luego defina A, = RQ. 


1. Demuestre primero que A, es semejante a A. Luego demuestre que A, tiene los 
mismos eigenvalores que A. 


1 0 
2. SIA= | | encuentre A, y verifique que tiene los mismos eigenvalores que A. 


Al continuar con el algoritmo, factorice A, como A, = Q,R, y establezca A, = R,Q,. 
Luego factorice A, = Q,R, y establezca Az = R,Q,, etcétera. Esto es: para k = 1, calcule 
A, = QR; y luego establezca Aj, ¡ = R¡Q; 


3. Demuestre que A, es semejante a A para todo k = 1. 


4. Continuando con el problema 2, calcule A,, A,, A, y Az usando precisión a dos 
lugares decimales. ¿Qué nota? 


Puede demostrarse que si los eigenvalores de A son todos reales y tienen distintos va- 
lores absolutos, entonces las matrices A, tienden a una matriz triangular superior U. 


5. ¿Cuáles serán las verdaderas entradas diagonales de esta matriz U? 


6. Aproxime los eigenvalores de las siguientes matrices al aplicar el algoritmo QR. 
Use precisión a dos lugares decimales y realice al menos cinco iteraciones. 


(a) Bl :] (b) h 1 


1.0 —-1 1 =l 
(c) 1.2  1| (d) 02 0 
24 0 1 —2 4 2 
: A . 2. 3 
7. Aplique el algoritmo QR a la matriz A = | A al ¿Qué ocurre? ¿Por qué? 
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8. Cambie los eigenvalores de la matriz en el problema 7 al sustituir A con B = 
A + 0.91. Aplique el algoritmo QR a B y luego cambie de nuevo al restar 0.9 de los ei- 
genvalores (aproximados) de B. Verifique que este método aproxima los eigenvalores de A. 


9. Sea Q, = Qy R, = R. Demuestre primero que 
QQ; *** Q;-14; = AQUQ1 *** Q;-: 
para todo k = 1. Luego demuestre que 
(QQ) +++ Qr)(Re ==: RiRo) = A(QUQ; *** Qr-1)(Rr-1 77 RiRo) 


[Sugerencia: use repetidamente el mismo método utilizado para la primera ecuación y 
trabaje “de adentro hacia afuera”.] Finalmente, deduzca que (QQ; *** Q, )(Rg: = R Ro) es 
la factorización QR de Aj; 
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Diagonalización ortogonal 
de matrices simétricas 


En el capítulo 4 se vio que una matriz cuadrada con entradas reales no necesariamente 


tendrá eigenvalores reales. De hecho, la matriz h 2] tiene eigenvalores complejos i 
y —i. También se descubrió que no todas las matrices cuadradas son diagonalizables. La 
situación cambia dramáticamente si se centra su atención en matrices simétricas reales. 
Como se demostrará en esta sección, todos los eigenvalores de una matriz simétrica real 
son reales y tal matriz siempre es diagonalizable. 

Recuerde que una matriz simétrica es aquella que es igual a su propia transpuesta. Co- 
mience por estudiar el proceso de diagonalización para una matriz simétrica de 2 X 2. 


> 
Ejemplo 5.1 1 2 
jemplo 5.16 Si es posible, diagolanice la matriz A = .. 
Solución El polinomio característico de A es A? +A — 6 = (A + 3XA — 2), de donde 
se ve que A tiene eigenvalores A, = —3 y A, = 2. Al calcular los eigenvectores correspon- 


dientes se encuentra 


respectivamente. De modo que A es diagonalizable, y si establece P = [v, v], enton- 


=3 0 
ces se sabe que P”*AP = | 6 S =D. 


Sin embargo, esto puede mejorarse. Observe que v, y v, son ortogonales. De modo 
que si se les normaliza para obtener los eigenvectores unitarios 


Lar lis 


y luego se toma 
O=1 | 1/ V5 275 | 
a =2/V5 1/V5 
también se tiene Q7'AQ = D. Pero ahora Q es una matriz ortogonal, pues {u}, u,} es un 


conjunto ortonormal de vectores. Por tanto, Q7! = Q? y se tiene QAQ = D. (Note que 
la comprobación es sencilla, ¡pues calcular Q7* sólo involucra tomar una transpuesta!) 


La situación del ejemplo 5.16 es la que tiene interés en este punto. Es lo suficiente- 
mente importante para garantizar una nueva definición. 


Definición Una matriz cuadrada A es diagonalizable ortogonalmente si existe 
una matriz ortogonal Q y una matriz diagonal D tales que QAQ = D. 


Se está interesado en encontrar condiciones para que una matriz sea diagonalizable 
ortogonalmente. El Teorema 5.17 muestra dónde buscar. 
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Teorema 5.17 


Si A es diagonalizable ortogonalmente, entonces A es simétrica. 


Demostración Si A es diagonalizable ortogonalmente , entonces existe una matriz orto- 
gonal Q y una matriz diagonal D tales que QAQ = D. Dado que Q7! = Q", se tiene 
QTQ = I = QQ”, de modo que 


QDQ” = QUAQO! = IAI = A 
Pero entonces 
AT = (QDQ”) = (QD D!Q” = QDQ" = A 


pues toda matriz diagonal es simétrica. En consecuencia, A es simétrica. 


Comentario Fl Teorema 5.17 muestra que las matrices diagonalizables ortogonal- 
mente se encuentran en el conjunto de las matrices simétricas. No dice que toda matriz 
simétrica debe ser diagonalizable ortogonalmente. Sin embargo, jes notable que esto 
de hecho sea verdadero! Encontrar una demostración para este resultado sorprendente 
ocupará gran parte del resto de esta sección. 


A continuación se probará que no es necesario preocuparse por los eigenvalores 
complejos cuando se trabaja con matrices simétricas con entradas reales. 


Teorema 5.18 


Si A es una matriz simétrica real, entonces los eigenvalores de A son reales. 


Recuerde que el conjugado complejo de un número complejo z = a + bi es el número z 
= a — bi (vea el Apéndice C). Para demostrar que z es real, es necesario demostrar que 
b = 0. Una forma de hacer esto es demostrar que z = z, pues entonces bi = —bi (o 2bi = 
0), de donde se tiene que b = 0. 

La noción de conjugado complejo también se extiende a vectores y matrices, por 
ejemplo, al definir A como la matriz cuyas entradas son los conjugados complejos de las 
entradas de A; esto es: si A = [a;;), entonces A = [a;]. Las reglas para la conjugación com- 
pleja se extienden fácilmente a matrices; en particular, se tiene AB= AB para matrices 
compatibles A y B. 


Demostración Suponga que A es un eigenvalor de A con su correspondiente eigenvec- 
tor v. Entonces Av = Av y, al tomar los conjugados complejos, se tiene Av = Av. Pero en- 
tonces 


AV=Av=Av=Av=Av 


pues A es real. Al tomar transpuestas y usar el hecho de que A es simétrica, se tiene 


VA = VA" = (Ay)! = (àv)! = àv" 


Por tanto, 


Mviw) = vw) = v(Av) = (v'A)v = (Av^)v = Aviv) 


, entonces v = : , de modo que 
bi 


n n 


a + bi a — bi 
Ahora, si v = : 


a, + b,i a 


vv = (a+ hb) ++ + (a + b) 40 
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pues v % 0 (porque es un eigenvector). Se concluye que À — A=0,0 A = A. En conse- 
cuencia, À es real. —— 


El Teorema 4.20 demostró que, para cualquier matriz cuadrada, los eigenvectores co- 
rrespondientes a distintos eigenvalores son linealmente independientes. Para matrices 
simétricas, algo más fuertes, es verdadero: tales eigenvectores son ortogonales. 


Teorema 5.19 


Si A es una matriz simétrica, entonces cualesquiera dos eigenvectores correspondien- 
tes a distintos eigenvalores de A son ortogonales. 


Demostración Sean v, y v, eigenvectores correspondientes a los distintos eigenvalores 
A,%A, de modo que Av, = Av; y Av, = àv. Al usar A? = A y el hecho de que x+ y = 
x'y para cualesquiera dos vectores x y y en R’, se tiene 


Av v) = (Av) v = Av ev = (Avi) v2 
= (v¡A%)v, = (v¡A)v, = vi(Av,) 
m vi(Av2) z3 A(viva) = (V v2) 


Por tanto, (A, — A,)(v, - v2) = 0. Pero A, — A, + 0, de modo que v; + v, = 0, como se 
quería demostrar. — 


Ejemplo 5.17 


Verifique el resultado del Teorema 5.19 para 


2 1 1 
A=|1 2 1 
t T2 
Solución El polinomio característico de A es ~A? + 61? — 9A + 4 = —(A — 4) 


(A — 1)? de donde se tiene que los eigenvalores de A son A, = 4 y A, = 1. Los corres- 
pondientes eigenespacios son 


1 =l =1 
E, = gen| | 1 y E, = gen 0j, 
1 1 0 


(Compruebe esto.) Fácilmente se verifica que 


1] Pi 1] [1 
1 0|=0 y |1 =0 
1 1 1 0 


de donde se tiene que todo vector en E, es ortogonal a todo vector en E, . (¿Por qué?) 


pe 


il =l 
Comentario Note que 0j. 1 | = 1. Por tanto, los eigenvectores correspon- 
1 0 


dientes al mismo eigenvalor no necesitan ser ortogonales. 
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Ahora puede demostrar el resultado principal de esta sección. Se le conoce como 
teorema espectral, pues el conjunto de eigenvalores de una matriz en ocasiones se llaman 
espectro de la matriz. (Técnicamente, el Teorema 5.20 debería llamarse teorema espec- 
tral real, pues existe un resultado correspondiente para matrices con entradas comple- 


jas.) 


Teorema 5.20 


Espectro es una palabra latina que 
significa “imagen”. Cuando los áto- 
mos vibran, emiten luz. Y cuando 
la luz pasa a través de un prisma, 
se dispersa en un espectro: una 
banda de colores del arco iris. 

Las frecuencias de vibración 
corresponden a los eigenvalores de 
cierto operador y son visibles 
como líneas brillantes en el espec- 
tro de luz que se emite desde un 
prisma. Por ende, literalmente 
pueden verse los eigenvalores del 
átomo en su espectro y, por esta 
razón, es adecuado que se aplique 
la palabra espectro al conjunto de 
todos los eigenvalores de una ma- 
triz (u operador). 


El teorema espectral 


Sea A una matriz real de n X n. Entonces A es simétrica si y sólo si es diagonalizable 
ortogonalmente. 


Demostración Ya se demostró la parte “si” como el Teorema 5.17. Para demostrar la im- 
plicación “sólo si”, se procederá por inducción sobre n. Para n = 1, no hay nada que 
hacer, pues una matriz de 1 X 1 ya está en forma diagonal. Ahora suponga que toda ma- 
triz simétrica real de k X k con eigenvalores reales es ortogonalmente diagonalizable. Sea 
n = k + 1y sea A una matriz simétrica real de n X n con eigenvalores reales. 

Sea A, uno de los eigenvalores de A y sea v, un eigenvector correspondiente. Enton- 
ces v, es un vector real (¿por qué?) y puede suponer que v, es un vector unitario, pues de 
otro modo puede normalizarse y todavía se tendrá un eigenvector correspondiente a À}. 
Al usar el proceso de Gram-Schmidt, puede extender v, a una base ortonormal 


{Vo V» + - + > V, ) de R”. Ahora se forma la matriz 
Qi = [vi va + Va] 
Entonces Q; es ortogonal y 
vi vi 
T T 
v. v. 
T o | 
QAQ, = : Alv, v v] = : [Av, Av, = Av] 
Va Y 
T 


En una conferencia que impartió en la Universidad de Göttingen en 1905, el matemático alemán 
David Hilbert (1862-1943) consideró que los operadores lineales actuaban sobre ciertos 
espacios vectoriales de dimensión infinita. De su conferencia surgió la noción de una forma 
cuadrática con infinitas variables, y fue en este contexto que Hilbert usó por primera vez el 
término espectro para dar a entender un conjunto completo de eigenvalores. Los espacios en 
cuestión ahora se llaman espacios de Hilbert. 

Hilbert realizó grandes aportaciones a muchas áreas de las matemáticas, entre ellas las 
ecuaciones integrales, la teoría de números, la geometría y los fundamentos de la matemática. 
En 1900, en el Segundo Congreso Internacional de Matemáticas en París, Hilbert presentó una 
conferencia titulada “Los problemas de las matemáticas”. En ella desafió a los matemáticos a 
resolver 23 problemas de importancia fundamental durante el siglo venidero. Muchos de los 
problemas se han resuelto (algunos resultaron verdaderos, otros falsos) y algunos acaso nunca 
puedan resolverse. No obstante, el discurso de Hilbert alentó a la comunidad matemática y con 
frecuencia se considera como el discurso más influyente jamás dado acerca de las matemáticas. 
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dado que v!(A,v,) = A (vivi) = A (vi evi) = A, y viv) = A (vivi) = A (v; v) =0 
para i + 1, porque [v,, V» . . . , v, | es un conjunto ortonormal. 
Pero 


B" = (QAQ: )" = QIA™(QT)" = QTAQ, =B 


de modo que B es simétrica. En consecuencia, B tiene la forma de bloque 


y A, es simétrica. Más aún, B es semejante a A (¿por qué?), de modo que el polinomio ca- 
racterístico de B es igual al polinomio característico de A, por el Teorema 4.22. Por el ejer- 
cicio 39 de la sección 4.3, el polinomio característico de A, divide al polinomio caracte- 
rístico de A. Se tiene que los eigenvalores de A, también son eigenvalores de A y, en 
consecuencia, son reales. También se ve que A, tiene entradas reales. (¿Por qué?) Por 
tanto, A, es una matriz simétrica real de k X k con eigenvalores reales, de modo que puede 
aplicar la hipótesis de inducción. Por tanto, existe una matriz ortogonal P, tal que P3A,P, 
es una matriz diagonal; por decir, D,. Ahora sea 


Entonces Q, es una matriz ortogonal (k + 1)X (k + 1) y por tanto también lo es Q = 
Q,0,. En consecuencia, 


QAQ = (Q,Q,)'A(Q¡Q,) = (QQ1)A(Q¡Q),) = QL(QÍAQ;)Q) = QBQ, 


E el Eo | Ra 
lo: PIilo ¿Aj JLo RB 


0 | PIAP, 
2 [24-2 | 
0 D 


que es una matriz diagonal. Esto completa el paso de inducción y se concluye que, para 
todo n = 1, una matriz simétrica real de n X n con eigenvalores reales es diagonalizable 
ortogonalmente. _ 


Ejemplo 5.18 


Diagonalice ortogonalmente la matriz 
2 1 1 
A=|1 2 1 
1.1.2 


Solución Ésta es la matriz del ejemplo 5.17. Ya se encontró que los eigenespacios de A 
son 


416 


Capítulo 5 Ortogonalidad 


Se necesitan tres eigenvectores ortonormales. Primero, aplique el proceso de Gram-Sch- 
midta 


- -1 
0 y 1 
1 0 
=Í =) 
para obtener 0 y 
1 
1 73 
= 
El nuevo vector, que se construyó para ser ortogonal a| 0 |, todavía está en E, (¿por 
1 
1 
qué?) y es ortogonal a | 1 |. Por ende, se tienen tres vectores mutuamente ortogonales, y 
1 


todo lo que necesita hacer es normalizarlos y construir una matriz Q con estos vectores 
como sus columnas. Se descubre que 


1V3 =1/Y2 =1/V8 
d=|1/V3 0 2/V6 
1/13 1/2 -1/v6 


y es fácil verificar que 


QAQ= 


oO o A 
o =- o 
Ho © 


"A 


El teorema espectral permite escribir una matriz simétrica real A en la forma A = 
QDA?, donde Q es ortogonal y D es diagonal. Las entradas diagonales de D son justo los 
eigenvalores de A, y si las columnas de Q son los vectores ortonormales q}, . - -> q,, en- 
tonces, al usar la representación columna-renglón del producto, se tiene 


A Saa 0 qË 
A = QDQ" = [q + 4,] if 
0 P Àn q 
qi 
= [àq ee Al 
qi 


= qiqi + Aggi + + Angaga 


A esto se le conoce como la descomposición espectral de A. Cada uno de los términos 
A,q,q/ es una matriz de rank 1, por el ejercicio 62 de la sección 3.5, y q,q/ es en realidad 
la matriz de la proyección sobre el subespacio generado por q,. (Vea el ejercicio 25.) Por 
esta razón, la descomposición espectral 


A =Aqu9 + 49293 ++ Anand 


en ocasiones se conoce como la forma en proyección del teorema espectral. 
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Ejemplo 5.19 


Encuentre la descomposición espectral de la matriz A del ejemplo 5.18. 


Solución Del ejemplo 5.18, se tiene: 


M= A =l, à =l 
1/3 -1/V2 -1/V6 
aq=|1/43 |) =| 0 | =| 2/v6 
1/V3 1/ V2 -1/V6 
Por tanto, 
1/V3 1/3 1/3 1/3 
qq =|11/43 [1/43 1/V3 1/V3]=|1/3 1/3 1/3 
1/V3 1/3 1/3 1/3 
=1/YV2 1/2 0 —1/2 
qq = 0  |[-1/V2 0 1/v2]= 0 0 0 
1/ V2 —1/2 0 1/2 
-1/V6 1/6 -1/3 1/6 
gq =| 2/V6|[-1/V6 2/VW6 -1/V6] =|-1/3 2/3 -1/3 
-1/V6 1/6 -1/3 1/6 
de modo que 
A= àqıqi + 129,97 + 439,93 
1 1 1 1 1 1 1 1 
2333 0 A 6 73 $ 
=4 133 l+[ oo of+[— 3 
1. 1 1 = 1 o l 1 
3 3 3 2 2 6 3 6 


que puede verificarse con facilidad. 
En este ejemplo, A, = Ay, así que se combinarían los últimos dos términos A,q,q/ + 
23947 para obtener 


l 


l 


l 
Gl wie Lalto 


l 


mie lo w= 
WIN w= w= 


La matriz qq} + qq} de rank 2 es la matriz de una proyección sobre el subespacio bi- 
dimensional (es decir, el plano) generado por q, y q. (Vea el ejercicio 26.) 


Observe que la descomposición espectral expresa una matriz simétrica A de manera 
explícita en términos de sus eigenvalores y eigenvectores. Esto proporciona una forma de 
construir una matriz con eigenvalores dados y eigenvectores (ortonormales). 


Ejemplo 5.20 


3 
Encuentre una matriz de 2 X 2 con eigenvalores A, = 3y À, = —2 y correspondientes ei- 
genvectores 
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Solución Comience por normalizar los vectores para obtener una base ortonormal 


19; q,),con 
q > | | Y QSS K | 


Ahora, calcule la matriz A cuya descomposición espectral es 


ala vw 
vw ve 


A = Aq + 19,97 


II 
W» 
A 
QA vw 
A | 
— 
ul 
ve 
sr 
l 
N 
i 
| 
v ve 
E 
— 

l 
ve 
ulw 
sr 


Mm=—> Es fácil comprobar que A tiene las propiedades deseadas. (Hágalo.) | 


ejercicios 5.4 
Y 


> 
Diagonalice ortogonalmente las matrices de los ejercicios 1-10 ib di li | _ļa b 
al encontrar una matriz ortogonal Q y una matriz diagonal tp O diagonalice ortogonalmente A = b al 
D tales que QAQ = D. 
a 0 b 
LAs E A de | 1 >] 12. Si b + O, diagonalice ortogonalmente A =|0 a O0]. 
A E 2 la 1 b 0a 
Y 13. Sean A y B matrices de n X n diagonalizables ortogonal- 
3. A = | 1 l 4. A= $ 2] mente y sea c un escalar. Use el teorema espectral para 
v2 0 2 3 probar que las siguientes matrices son diagonalizables 
ortogonalmente: 
500 1 0 2 (a) A+B (b) cA (c) A? 
apa (102 L. a 6% A 14. Si A es una matriz invertible que es diagonalizable orto- 
0 3 1 4 2 gonalmente, demuestre que A”! es diagonalizable ortogo- 
nalmente. 
Ae 2k =l 15. Si A y B son diagonalizables ortogonalmente y AB = BA, 
7.A= 0 1 0 8&8 4A=|-1 2 -l demuestre que AB es diagonalizable ortogonalmente. 
-Z1 0 1 A AL 16. Si A es una matriz simétrica, demuestre que todo eigen- 
1100 3 0 0 1 valor de A es no negativo si y sólo si A = B? para alguna 
1100 02 00 matriz simétrica B. 
9.A = 10. A = 
0 0 2 0 
ED A En los ejercicios 17-20, encuentre una descomposición espec- 
0.0 1 1 1 0 0 3 


tral de la matriz en el ejercicio dado. 


17. Ejercicio 1 18. Ejercicio 2 


19. Ejercicio 5 20. Ejercicio 8 


En los ejercicios 21 y 22, encuentre una matriz de 2 X 2 con 
eigenvalores A, y A, y correspondientes eigenvectores ortogona- 
les v, y vz. 


1 1 
ei a 


1 
le lee 


En los ejercicios 23 y 24, encuentre una matriz simétrica de 
3 X 3 con eigenvalores A,, A, y A, y correspondientes eigen- 


25. 


26. 
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Sea q un vector unitario en R” y sea W el subespacio ge- 
nerado por q. Demuestre que la proyección ortogonal 
de un vector v sobre W (como se definió en las secciones 
1.2 y 5.2) está dada por 
proyw(v) = (qg”)v 

y que la matriz de esta proyección es, por tanto, qq”. 
[Sugerencia: recuerde que para x y y en R”, x- y = x'y.] 
Sea (q; .. -> q,) un conjunto ortonormal de vectores en 
R” y sea W el subespacio generado por este conjunto. 
(a) Demuestre que la matriz de la proyección ortogonal 

sobre W está dada por 


P = qiqi +++ qua 


vectores ortogonales V, V, Y V3. 


(b) Demuestre que la matriz de proyección P en el in- 
ciso (a) es simétrica y satisface P? = P. 


1 1 (c) Sea Q = [q q] la matriz de n X k cuyas co- 
23. À = l, ù% = 2, \ = 3, v, lhv =j|=lj, lumnas son los vectores base ortonormales de W. 
0 1 Demuestre que P = QQ? y deduzca que rank(P) 
—1 =k. 
v= 1 27. Sea A una matriz real de n X n, cuyos eigenvalores son 
2 todos reales. Demuestre que existe una matriz ortogonal 
Q y una matriz triangular superior T tales que Q'AQ = 
1 1 T. Este muy útil resultado se conoce como teorema de 
24. = L= 2A = 2v ls lt Triangularización de Schur. [Sugerencia: adapte la 
i ; prueba del teorema espectral. ] 
l 28. Sea A una matriz nilpotente (vea el ejercicio 56 de la 
B sección 4.2). Demuestre que existe una matriz ortogonal 
pel Q tal que Q7 AQ es triangular superior con ceros en su 
2 


»—> 


diagonal. [Sugerencia: use el ejercicio 27.] 


Aplicaciones 


Existen muchas formas de construir nuevos códigos a partir de los antiguos. En esta sec- 
ción se considerará uno de los más importantes de ellos. 

Primero, es necesario generalizar los conceptos de un generador y una matriz de 
control de paridad para un código. Recuerde de la sección 3.7 que una matriz genera- 
dora estándar para un código es una matriz de n X m de la forma 


y una matriz de verificación de paridad estándar es una matriz (n — m) X n de la forma 
P= [B i rl 


Observe que la forma de dichas matrices garantiza que las columnas de G y los renglo- 
nes de P sean linealmente independientes. (¿Por qué?) Al demostrar el Teorema 3.37 se 
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demostró que G y P están asociadas con el mismo código si y sólo si A = B, lo que equi- 
vale a requerir que PG = O. Use estas propiedades como la base para la siguiente defini- 
ción. 


Definición Paran > m, una matriz G den X m y una matriz P de (n—k) X n 
(con entradas en Z,) son una matriz generadora y una matriz de control de paridad, 
respectivamente, para un código C binario (n, k) si se satisfacen todas las condiciones 
siguientes: 


1. Las columnas de G son linealmente independientes. 
2. Los renglones de P son linealmente independientes. 
3. PG = O 


Note que la propiedad (3) implica que toda columna v de G satisface Pv = 0 y por 
tanto es un vector código en C. Además, un vector y está en C si y sólo si se obtiene a par- 
tir de la matriz generadora como y = Gu para algún vector u en Z;. En otras palabras, C 
es el espacio columna de G. 

Para entender la relación entre diferentes matrices generadoras para el mismo có- 
digo, sólo necesita recordar que así como las operaciones elementales con renglón no 
afectan el espacio renglón de una matriz (por el Teorema 3.20), las operaciones elemen- 
tales en columna no afectan el espacio columna. Para una matriz sobre Z,, sólo existen 
dos operaciones relevantes: intercambio de dos columnas (C1) y la adición de una co- 
lumna a otra (C2). (¿Por qué estas son las únicas dos operaciones elementales en columna 
para matrices en Z,?) 

De igual modo, las operaciones elementales con renglón conservan la independencia 
lineal de los renglones de P. Más aún: si E es una matriz elemental y c es un vector có- 
digo, entonces 


(EP)c = E(Pc) = E0 = 0 


Se tiene que EP también es una matriz de control de paridad para C. En consecuencia, 
cualquier matriz de control de paridad puede convertirse en otra mediante una secuen- 
cia de operaciones con renglón: intercambiar dos renglones (R1) y sumar un renglón a 
otro (R2). Se está interesado en demostrar que cualquier matriz generadora o de control 
de paridad puede llevarse a forma estándar. Existe otra definición que se necesita. Dos 
códigos C, y C, se llamarán equivalentes si existe una matriz permutación M tal que 


[Mx : x en C} = C, 


En otras palabras, si se permutan las entradas de los vectores en C, (todas en la misma 
forma), puede obtenerse C,. Por ejemplo, 


0 1 1 0 0 0 1 1 
C = > 0 > 0 > 0 y G; = 0 > > 1 > 0 
0 0 1 1 0 0 0 0 
0.0 1 
son equivalentes vía la matriz permutación M = | 1 0 0 |. Permutar las entradas de 
1 


0 0 
vectores código corresponde a permutar los renglones de una matriz generadora y per- 
mutar las columnas una matriz de control de paridad para el código. (¿Por qué?) 
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Es posible llevar una matriz generadora para un código a forma estándar mediante 
las operaciones C1, C2 y R1. Si no se usó R1, entonces se tiene el mismo código; si se usó 
R1, entonces se tiene un código equivalente. Puede llevar cualquier matriz de control de 
paridad para un código a forma estándar mediante las operaciones R1, R2 y C1. Si no se 
usó C1, entonces se tiene el mismo código; si se usó C1, entonces se tiene un código equi- 
valente. 

Los siguientes ejemplos ilustran estos puntos. 


Ejemplo 5.21 (a) Lleve la matriz generadora 
0 
G=|1 0 
1 


a la forma estándar y encuentre una matriz de control de paridad asociada. 


(b) Lleve la matriz de control de paridad 
1.0.0 '| 
P= 
0 1 1 1 
a la forma estándar y encuentre una matriz generadora asociada. 


Solución (a) Puede llevar la matriz generadora G a la forma estándar del modo si- 


guiente: 
1 0 1 0 
RR; I 
e= [ro lor - ¿0 
0 1 1 0 


D> (¿Ve por qué no es posible obtener una forma estándar sin usar R1?) Por tanto, A = 
[1 0], de modo que 


P=[4:1D=[1 0 1] 


es una matriz de control de paridad asociada, por el Teorema 3.37. 

(b) Use operaciones elementales por renglones para llevar P a la forma estándar y tenga 
en mente que se quiere crear una matriz identidad a la derecha, no a la izquierda, como en 
la eliminación de Gauss-Jordan. Calcule 


L0 Y 1 10 1 1 14% T 1 1 0 l , 
P= = ==} = [AI] =P 
0 1 1 1 1 0 0 1 1 0 0 1 


1 1 
Por tanto, A = | j al de modo que, por el Teorema 3.37, una matriz generadora aso- 


ciada es 


Q 
II 
e | 
Din 
(DE. 
II 
Rh =. O m 
O =.. © 


s 


Comentario En el inciso (a), es instructivo verificar que G y G’ generan códigos 

»ə—> equivalentes, mas no idénticos. Compruebe que esto es así al calcular {Gx : x en Z3} y 
{G'x:x en Z}. 

Ahora regrese su atención al tema principal de esta sección: la noción de código dual. 
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Definición Sea C un conjunto de vectores código en Z4. El complemento orto- 
gonal de C se llama código dual de C y se denota C+. Esto es, 


C+ = {xen Zl: c -x = 0 paratodocenC ) 


El producto punto en Z; se comporta como el producto punto en R”, con una ex- 
cepción importante: la propiedad (d) del Teorema 1.2 ya no es verdadero. En otras pala- 
bras, en Z5, ¡un vector distinto de cero puede ser ortogonal a sí mismo! Como un ejem- 


1 
plo, considere x = A en Z3. Entoncesx-x=1+1=0. 


Ejemplo 5.22 


»— 


Encuentre el código dual del código C en el ejemplo 5.21(b). 


Solución El código C es 


C = {Gx: xen Zi) 


II 
A= 
Q 
e) | 
oso 
¡== 
O 
———— 
Rh o 
A 
Q 
a 
O m. 
=== 
O 
e | 
Rh = 
y 
=—— 
II 
oooo 


Rh = O = 
pi S p ja 


0 
1 
LP 
0 


[De manera alternativa, C = {c en Z*: Pc = 0) = nulo(P). Compruebe que esto real- 
mente produce el mismo código.] 

Para encontrar C*, es necesario que dichos vectores en Z3 que son ortogonales a los 
otros cuatro vectores en C. Puesto que sólo existen 16 vectores en Z3, podría proceder 
por ensayo y error, pero aquí hay un método mejor. Sea y =[y, y, y, yal T que está 
en C+. Puesto que y -c = 0 para cada c en C, se tienen cuatro ecuaciones, una de las cua- 
les puede ignorarse, pues sólo dice que 0 = 0. Las otras tres son 


Al resolver este sistema se obtiene 
0 1 1 0j0 1.0 1 10 
10 1 1J0|—>|0 1 1 010 
1 1 O 10 0 0 0 00 


(Compruebe esto.) Se tiene que y, = y, + Y, y Y, = Yz, de modo que 


Yz + Ys 1 1 0 1 1 0 
y 1 0 opio (1 
C E ? J Y3 +y, z > > > 
Y 1 0 opli Plopi 
Ya 0 1 oj Loj Li 1 
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Ahora se examina la relación entre las matrices generadora y de control de paridad 
de un código y su dual. 


Teorema 5.21 


Ejemplo 5.23 


Si C es un código binario (n, k) con matriz generadora G y matriz de control de pari- 
dad P, entonces C+ es un código binario (n, n — k) tal que 


a. G" es una matriz de verificación de paridad para C+. 
b. P” es una matriz generadora para C+. 


Demostración Por definición, G es una matriz de n X k con columnas linealmente in- 
dependientes, P es una matriz (n — k) X n con renglones linealmente independientes y 
PG = O. Por tanto, los renglones de G” son linealmente independientes, las columnas de 
P” son linealmente independientes y 


GP! = (PG) = O" = O 


Esto demuestra que G” es una matriz de control de paridad para C+ y P" es una matriz 
generadora para C+. Dado que P” es n X (n — k), C+ es un código (n, n — k). 
—— 


Encuentre las matrices generadora y de verificación de paridad para el código dual C+ 
del ejemplo 5.22. 


Solución Existen dos formas de proceder. Se ilustrarán ambos métodos. 


Método 1: de acuerdo con el Teorema 5.21(b), una matriz generadora G* para C* 
está dada por 


| 
=. oOo oOo me 
Rh = a O 


: 0 1 ; 
Esta matriz está en forma estándar con A = k A de modo que una matriz de con- 


trol de paridad para C* es 


por el Teorema 3.37. 
Método 2: con el Teorema 5.21 (a) y con referencia al ejemplo 5.21(b), se obtiene una 
matriz de control de paridad P* para C* del modo siguiente: 


a” 

pr=gr=|0 1 Ed 
1 1 0.1 10 
1 0 


Esta matriz no está en forma estándar, así que se usan operaciones elementales con ren- 
glones para convertirla en 
F | 1 0 1 1 0110 
P= — 
0.1 10 


= [AT] = P} 
o AUN l 
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Ahora puede usar el Teorema 3.37 para obtener una matriz generadora G+ para C+: 


1 0 
I 0 1 
G =|= 
loa 
1 1l A 
> 
Ejemplo 5.24 Sea C el código con matriz generadora 
1 0 
0 1 
G= 
1 0 
0 1 
Mencione los vectores en C y C+. 
Solución El código C es 
0 1 0 1 
0 0 1 1 
C = (Gx: Z; = ; > ; 
a oPliplioPia 
0 0 1 1 


(Note que C es un código de doble repetición que codifica vectores de Z¿como vectores 
en Z; al escribir las entradas dos veces. Vea el ejercicio 79 de la sección 3.7.) Con el Teo- 
rema 5.21, se encuentra que la matriz de control de paridad P* para C* es 


P+ = @ = 


O = O = 
a E A O 
Il 
———— 
O =. 
Rh o 
O = 
Rh O 
_—_— 


Por ende, P+ tiene la forma [A | I], donde A = I, de modo que una matriz generadora 
G+ para C+ es 


=. onmo 
Il 
a 


En consecuencia, C+ tiene la misma matriz generadora que C, ¡de modo que C+ = C! 


E. 


Un código C con la propiedad de que C+ = C se llama autodual. Puede comprobar 
que el código del ejemplo 5.24 es autodual al demostrar que todo vector en C es ortogo- 
nal a todos los vectores en C, incluido él mismo. (Hágalo.) 

Acaso haya notado que, en el código autodual del ejemplo 5.24 todo vector en C 
tiene un número par de números 1. Se demostrará que esto es verdadero para todo có- 
digo autodual. La siguiente definición es útil. 


Teorema 5.22 
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E Jessie MacWilliams (1917-1990) fue una de las pioneras en la teoría de codificación. Recibió su 
licenciatura y maestría en la Cambridge University en 1938-39, después de lo cual estudió en 
Estados Unidos, en la Johns Hopkins University y en Harvard University. Después de casarse y 
criar a su familia, MacWilliams tomó un puesto como programadora de computadoras en los 
Bell Laboratories en Murray Hill, New Jersey, en 1958, donde comenzó a interesarse en la teoría 
de codificación. En 1961 regresó a Harvard durante un año y obtuvo su doctorado. 

Su tesis contiene uno de los teoremas más poderosos de la teoría de codificación. Ahora 
conocido como las identidades MacWilliams, este teorema relaciona la distribución ponderada 
(el número de palabras código de cada peso posible) de un código lineal, con la distribución 
ponderada de su código dual. Los teóricos en codificación usan ampliamente las identidades 
MacWilliams tanto para obtener nueva información teórica acerca de los códigos de corrección 
de errores, como para determinar las distribuciones ponderadas de códigos específicos. 

MacWilliams acaso es mejor conocida por su libro The Theory of Error-Correcting Codes 
(1977), escrito con N. J. A. Sloane de Bell Labs. Con frecuencia este libro se conoce como “la 
biblia de la teoría de codificación”. En 1980, MacWilliams pronunció el discurso inaugural 
Emmy Noether de la Asociación de Mujeres en Matemáticas. 


Definición Sea x un vector en Z”. El peso de x, denotado w(x), es el número de 
números 1 en x. 


Por ejemplo, w([1 1 0 1 0 0 1]%) = 4. Si temporalmente considera x 
como un vector en R”, entonces pueden proporcionarse las siguientes descripciones al- 
ternativas de w(x). Sea 1 que denota al vector (de la misma longitud que x) cuyas entra- 
das son todas 1. Entonces w(x) = x: 1 y w(x) = x-x. Ahora puede probar los siguientes 
hechos interesantes acerca de los códigos autoduales. 


Si C es un código autodual, entonces: 


a. Todo vector en C tiene peso par. 
b. 1 está en C. 


Demostración (a) Un vector x en Z; tiene peso par si y sólo si w(x) = 0 en Z,. Pero 
w(x) =x-x=0 
pues C es autodual. 


(b) Con la propiedad (a), se tiene 1-x = w(x) = 0 en Z, para toda x en C. Esto significa 
que 1 es ortogonal a todo vector en C, de modo que 1 está en C+ = C, como se requiere. 
— 


Una expresión de la forma 
ax? + by? + cxy 
se llama forma cuadrática en x y y. De igual modo, 
ax? + by? + cz? + dxy + exz + fyz 


es una forma cuadrática en x, y y z. En palabras: una forma cuadrática es una suma de 
términos, cada uno de los cuales tiene grado dos. Por tanto, 5x? — 3y? + 2xy es una 
forma cuadrática, pero x? + y? + x no lo es. 
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Las formas cuadráticas pueden representarse usando matrices del modo siguiente: 


ax? + by? + cxy = [x al FIG 


a d2 ef2||x 
ax? + by? + cz? + dxy + exz + fyz=|x y zļ|| d2 b f2||y 
e/2 f2 c jLz 


(Verifique esto.) Cada una tiene la forma x"Ax, donde la matriz A es simétrica. Esta ob- 
servación conduce a la siguiente definición general. 


Definición Una forma cuadrática con n variables es una función f: R" —> R de 
la forma 


f(x) = x'Ax 


donde A es una matriz simétrica de n X n y x está en R”. A se conoce como matriz 
asociada con f. 


Ejemplo 5.25 


> 
4 e ; ; 2 =3 
¿Cuál es la forma cuadrática con matriz asociada A = 3 5 ? 
ES A X 
Solución Si x = , entonces 
X 


2 =3 
f(x) = Ax = [x saf E = 2x7 + 5x2 — 6x2, 


al 


Observe que las entradas fuera de la diagonal a,, = a,, = —3 de A se combinan para 
producir el coeficiente —6 de x,x,. En general esto es verdadero. Es posible desarrollar 
una forma cuadrática con n variables x"Ax del modo siguiente: 


X'Ax = au + + Y La 
ij 


Por tanto, sii + j, el coeficiente de X;X; es 24; 


Ejemplo 5.26 


Encuentre la matriz asociada con la forma cuadrática 
= 2 2 2 
f(x Xa» X3) = 2x — x7 + 5x5 + 6xX, — 3x1% 
Solución Los coeficientes de los términos al cuadrado x? pasan a la diagonal como a,, 
y los coeficientes de los términos en x,x; se dividen entre a, y a; Esto produce 
3 
2 2 s 
A=| 3 -1 0 
3 
=3 0 5 
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deestemodo f(x, x»%) =[xļ x xx] 3 -1 oll% 


como puede comprobar fácilmente. 
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m. 


En el caso de una forma cuadrática f(x, y) con dos variables, la gráfica de z = f(x, y) 


es una superficie en R’. En la figura 5.12 se muestran algunos ejemplos. 


Observe que el efecto de mantener x o y constante es tomar una sección transversal 
de la gráfica paralela a los planos yz o xz, respectivamente. Para las gráficas de la figura 
5.12, todas estas secciones transversales son fáciles de identificar. Por ejemplo, en la fi- 
gura 5.12(a), las secciones transversales que se obtienen al mantener x o y constante son 
todas parábolas que se abren hacia arriba, de modo que f(x, y) = 0 para todos los valo- 
res de x y y. En la figura 5.12(c), mantener x constante produce parábolas que se abren 
hacia abajo y mantener y constante produce parábolas que se abren hacia arriba, lo que 


produce un punto de silla. 


NN 


Ñ 


Ñ 


A 


(a) z = 2x? + 3y? b) z= =% = 3y 


TN 
Nn 
VLLL 
ASS 
SS SSI UUH 
AS SS 
SS 
ASIS 
SOS 
(c) z = 2x2 — 3y? (d) z = 2x2 
Figura 5.12 


Gráficas de formas cuadráticas f(x, y) 


NU ES 
VEKAN AX 
VERO RRN 
SS SEN 
MONOS 
A 
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Lo que hace a este tipo de análisis muy sencillo es el hecho de que estas formas cuadráti- 
cas no tienen términos en xy. La matriz asociada con tal forma cuadrática es una matriz 
diagonal. Por ejemplo, 


la 


0 —3|ly 


En general, la matriz de una forma cuadrática es una matriz simétrica y en la sección 5.4 
se vio que tales matrices siempre pueden diagonalizarse. Ahora se usará este hecho para 
demostrar que, para toda forma cuadrática, es posible eliminar los términos en xy me- 
diante un cambio adecuado de variable. 

Sea f(x) = x"Ax una forma cuadrática con n variables, con A como matriz simétrica 
de n X n. Por el Teorema espectral, existe una matriz ortogonal Q que diagonaliza A; esto 
es, QAQ = D, donde D es una matriz diagonal que muestra los eigenvalores de A. Ahora 
se establece 


x = Qy o de manera equivalente, y =Q x= Q'x 
La sustitución en la forma cuadrática produce 


x'Ax = (Qy)'A(Qy) 
= y QAQy 
= y Dy 


que es una forma cuadrática sin términos en xy, pues D es diagonal. Más aún, si los ei- 


genvalores de A son A,,..., A,, entonces Q puede elegirse de tal modo que 
A 0 
D=|: ; 
0 À, 
Siy = [yı = J,]', entonces, con respecto a estas nuevas variables, la forma cuadrá- 


tica se convierte en 
y Dy = My +: + Aya 


Este proceso se llama diagonalización de una forma cuadrática. Acaba de demostrarse 
el siguiente teorema, conocido como teorema de los ejes principales. (La razón de este 
nombre se volverá clara en la siguiente subsección.) 


Teorema 5.23 


El teorema de los ejes principales 


Toda forma cuadrática puede diagonalizarse. Específicamente, si A es la matriz simé- 
trica de n X n asociada con la forma cuadrática x"Ax y si Q es una matriz ortogonal 
tal que QAQ = D es una matriz diagonal, entonces el cambio de variable x = Qy 
transforma la forma cuadrática x"Ax en la forma cuadrática y'Dy, que no tiene tér- 
minos en xy. Si los eigenvalores de A son A, ..., A, y y = [yı = yn)", entonces 


xAx =yDy = A TE A 
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Ejemplo 5.27 


Encuentre un cambio de variable que transforme la forma cuadrática 
fa) = 5% + 4% +26 


en una sin términos en xy. 


Solución La matriz de f es 
3 2 
A= 
2 2 
con eigenvalores A, = 6 y A, = 1. Los correspondientes eigenvectores unitarios son 


afix] re Laos 


(Compruebe esto.) Si se establece 


Lips opos) Y Pl 


entonces Q7AQ = D. El cambio de variable x = Qy, donde 
Els la 
X Y 
6 0||y 
FY) = foz) = [n ya $ e] ] = 6yi +y? 
Y f 


convierte fen 


La forma cuadrática original x"Ax y la ahora nueva y'Dy (a la que se hace referencia en 
el teorema de los ejes principales) son iguales en el siguiente sentido. En el ejemplo 5.27, 


1 
suponga que se quiere evaluar f(x) = x"Ax en x = | al Se tiene 


f(—1,3) = 5-1)? + 4-DG) + 23) = 11 
En términos de las nuevas variables, 
es ell lv 
sl FL yv aval 3) 7 l-7/45 


de modo que 
fWy.) = 6 + y} = 6(1/V5) + (27/V5) = 55/5 = 11 


exactamente como antes. 

El teorema de los ejes principales tiene algunas consecuencias interesantes e impor- 
tantes. Se considerarán dos de ellas. La primera se relaciona con los posibles valores que 
puede tomar una forma cuadrática. 


Definición Una forma cuadrática f(x) = x"Ax se clasifica como una de las si- 


guientes: 


1. definida positiva si f(x) > 0 para toda x + 0 

2. semidefinida positiva si f(x) = 0 para toda x 

3. definida negativa si f(x) < 0 para toda x % 0 

4. semidefinida negativa si f(x) = 0 para toda x 

5. indefinida si f(x) toma valores tanto positivos como negativos 
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Una matriz simétrica A se llama definida positiva, semidefinida positiva, definida 
negativa, semidefinida negativa o indefinida si la forma cuadrática asociada f(x) 
= x"Ax tiene la propiedad correspondiente. 


Las formas cuadráticas de los incisos (a), (b), (c) y (d) de la figura 5.12 son definida 
positiva, definida negativa, indefinida y semidefinida positiva, respectivamente. El Teo- 
rema de los ejes principales facilita decir si una forma cuadrática tiene una de dichas 
propiedades. 


Teorema 5.24 


Sea A una matriz simétrica de n X n. La forma cuadrática f(x) = x"Ax es 


positiva definida si y sólo si todos los eigenvalores de A son positivos. 
semidefinida positiva si y sólo si todos los eigenvalores de A son no negativos. 
definida negativa si y sólo si todos los eigenvalores de A son negativos. 

. semidefinida negativa si y sólo si todos los eigenvalores de A son no positivos. 
indefinida si y sólo si A tiene eigenvalores tanto positivos como negativos. 


PAST» 


En el ejercicio 49 se le pide demostrar el Teorema 5.24. 


Ejemplo 5.28 


> 
Clasifique f(x, y, z) = 3x + 3y? + 32? — 2xy — 2xz — 2yz como definida positiva, defi- 
nida negativa, indefinida o ninguna de ellas. 


Solución La matriz asociada con f es 


3 =l =1l 
=] 3 =1 
=1 =1 3 


que tiene eigenvalores 1, 4, y 4. (Verifique esto.) Dado que todos estos eigenvalores son 
positivos, fes una forma cuadrática definida positiva. 


Si una forma cuadrática f(x) = x"Ax es definida positiva, entonces, dado que f(0) = 
0, el valor mínimo de f(x) es 0 y se ubica en el origen. De igual modo, una forma cuadrá- 
tica definida negativa tiene un máximo en el origen. Por ende, el Teorema 5.24 permite 
resolver con facilidad ciertos tipos de problemas de máximos/mínimos, sin depender del 
cálculo. Un tipo de problema que se incluye en esta categoría es el problema de optimi- 
zación restringida. 

Con frecuencia es importante conocer los valores máximo o mínimo de una forma 
cuadrática sujeta a ciertas restricciones. (Tales problemas surgen no sólo en matemáti- 
cas, sino también en estadística, física, ingeniería y economía.) Se está interesado en en- 
contrar los valores extremos de f(x) = x"Ax sujetos a la restricción de que ||x|| = 1. En el 
caso de una forma cuadrática con dos variables, puede visualizar qué significa el pro- 
blema. La gráfica de z = f(x, y) es una superficie en R?, y la restricción |x| = 1 restringe 
el punto (x, y) a la circunferencia unitaria en el plano xy. Por tanto, se consideran aque- 
llos puntos que están simultáneamente en la superficie y en el cilindro unitario perpen- 
dicular al plano xy. Dichos puntos forman una curva que se encuentra sobre la superfi- 
cie, y se quieren los valores más alto y más bajo sobre esta curva. La figura 5.13 muestra 
esta situación para la forma cuadrática y la superficie correspondiente en la figura 
5.12(c). 
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z 
= y 
x 
Figura 5.13 
La intersección de z = 2x? — 3y? con el cilindro 
x +y =l 


En este caso, los valores máximo y mínimo de f(x, y) = 2x? — 3y? (los valores más 
alto y más bajo sobre la curva de intersección) son 2 y — 3, respectivamente, que son 
justo los eigenvalores de la matriz asociada. El Teorema 5.25 muestra que este siempre es 
el caso. 


Teorema 5.25 


Sea f(x) = xAx una forma cuadrática con matriz simétrica asociada A de n X n. Sean 
À; = A, == A, los eigenvalores de A. Entonces lo siguiente es verdadero, sujeto a 
la restricción [|x| = 1: 


a A=f(0)=A,. 

b. El valor máximo de f(x) es A, y ocurre cuando x es un eigenvector unitario co- 
rrespondiente a À}. 

c. El valor mínimo de f(x) es A, y ocurre cuando x es un eigenvector unitario corres- 
pondiente a A,. 


Demostración Como siempre, comience por diagonalizar ortogonalmente A. En con- 
cordancia, sea Q una matriz ortogonal tal que QAQ es la matriz diagonal 


Entonces, por el teorema de los ejes principales, el cambio de variable x = Qy produce 
x"Ax = y'Dy. Ahora note que y = Q*x implica que 


yy = (Qx) (Qx) = x (Q) "Qx = x"QQ'x = xIx 


- ; T, T 
pues Q7 = Q”?. En consecuencia, al usar x + x = xx, se ve que |y = Vy Y XX 
|x|| = 1. Por tanto, si x es un vector unitario, también lo es su correspondiente y, y los va- 
lores de x"Ax y y*Dy son los mismos. 
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Ejemplo 5.29 


(a) Para demostrar la propiedad (a), observe que si y = [y, = y,]”, entonces 
f(x) = Ax = y'Dy 

= MYE H Aya Eo H Ayn 

S AYE HAY H + A 

= Ai +y +e + ya) 

= àilyl? 

=A 
Por tanto, f(x) < A, para todo x tal que ||x|| = 1. La demostración de que f(x) = A, es si- 
milar. (Vea el ejercicio 59.) 


(b) Si q, es un eigenvector unitario correspondiente a À}, entonces Aq; = 4,9, y 


f(q1) = qq; = q/1q, = A(qíq,) = Ar 


Esto muestra que la forma cuadrática en realidad toma el valor A, y, de este modo, por la 
propiedad (a), es el valor máximo de f(x) y ocurre cuando x = q}. 


(c) En el ejercicio 60 se le pide demostrar esta propiedad. E 


Encuentre los valores máximo y mínimo de la forma cuadrática f(x,,x,) = 5x7 + 4x,x, + 
2x4 sujeta a la restricción x? + x3 = 1, y determine los valores x, y x, para los cuales se 
presentan cada uno de ellos. 


Solución En el ejemplo 5.27 se encontró que f tiene los eigenvalores asociados A, = 6 y 
A, = 1, con correspondientes eigenvectores unitarios 


a = [ia] 


EEN 


Por tanto, el valor máximo de fes 6 cuando x, = 2/ V5y x, = 1/ V5. El valor mínimo 
de fes 1 cuando x, = 1/V5 y x, = —2/ V5. (Observe que estos valores extremos ocu- 
rren dos veces, en direcciones opuestas, pues —q, y ~q, también son eigenvectores uni- 


tarios para A, y A, respectivamente.) | 


Graficación de ecuaciones cuadráticas 


La forma general de una ecuación cuadrática con dos variables x y y es 
ad+by+oayrFditey+f=0 


donde al menos uno de a, b y c es distinto de cero. Las gráficas de tales ecuaciones cua- 
dráticas se llaman secciones cónicas (o cónicas), pues pueden obtenerse al tomar seccio- 
nes transversales de un cono (doble) (es decir, rebanándolo con un plano). Las más im- 
portantes de las secciones cónicas son las elipses (con las circunferencias como un caso 
especial), hipérbolas y parábolas. A las mismas se les llama cónicas no degeneradas. La 
figura 5.14 muestra cómo surgen. 

También es posible que una sección transversal de un cono resulte en un solo punto, 
una recta o un par de rectas. A ellas se les llaman cónicas degeneradas. (Vea los ejercicios 
81-86.) 

Se dice que la gráfica de una cónica no degenerada está en posición estándar en re- 
lación con el eje coordenado si su ecuación puede expresarse en una de las formas de la 
figura 5.15. 


Sección 5.5 Aplicaciones 433 


' 


Circunferencia Elipse Parábola Hipérbola 
Figura 5.14 
Las cónicas no degeneradas 
a y 
Elipse o circunferencia: q + P l;a,b > 0 
y a y 
A 
b a 
b 
-a ax —a a ny =å a ox 
=b 
Ep =á 
a>b a<b a=b 
Hipérbola 
y y 
A XI 
b 
A l Sž >x 
A 
2 2 2. 52 
O X 
Žo- > 4-5 =1 > 
== 1,a,b>0 pa ,ab>0 
Parábola 
y y y y 
A A A 4 
>x >x >x D> >x 
y=ax, a>0 y=ax, a<0 x=ay, a>0 x=ay, a<0 


Figura 5.15 
Cónicas no degeneradas en posición estándar 
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z= 
Si es posible, escriba cada una de las siguientes ecuaciones cuadráticas en la forma de una 
cónica en posición estándar e identifique la gráfica resultante. 


(a) 4x? + 9y? = 36 (b) 4x? —9y?+1=0 (c) 4x? — 9y =0 


Solución (a) La ecuación 4x? + 9y? = 36 puede escribirse en la forma 


x2 
— + 
9 


de modo que su gráfica es una elipse que interseca el eje x en (+3, 0) y el eje y en (0, +2). 
(b) La ecuación 4x? — 9y? + 1 = 0 puede escribirse en la forma 


2 
xX 
T= mi 


9 4 
de modo que su gráfica es una hipérbola que se abre hacia arriba y abajo, e interseca el 
eje y en (0, +3). 
(c) La ecuación 4x? — 9y = 0 puede escribirse en la forma 
4 


id 
y 9% 


de modo que su gráfica es una parábola que abre hacia arriba. 


ed 


Si una ecuación cuadrática contiene demasiados términos para escribirse en una de 
las formas de la figura 5.15, entonces su gráfica no está en posición estándar. Cuando 
existen términos adicionales más no término xy, la gráfica de la cónica se trasladó fuera 
de la posición estándar. 


Ejemplo 5.31 


Identifique y grafique la cónica cuya ecuación es 
x? + 2y’ — 6x+8y+9=0 
Solución Comience por agrupar los términos x y y por separado para obtener 


(x? — 6x) + (2y? + 8y) = —9 


(x? — 6x) + 2(y? + 4y) = —9 


A continuación, complete los cuadrados en las dos expresiones entre paréntesis para ob- 
tener 


(x? — 6x + 9) + Ay? + dy + 4) = -94+9+8 


(x=3P+Ay+2)=8 
Ahora haga las sustituciones x’ = x — 3 y y' = y + 2, y convierta la ecuación anterior en 


ny2 2. = œY vY 
(xY +2(y')=8 o à + a =i 


Sección 5.5 Aplicaciones 435 


Esta es la ecuación de una elipse en posición estándar en el sistema coordenado xy”, que 
interseca el eje x' en (+2V2, 0) y el eje y en (0, +2). El origen en el sistema coordenado 
x'y' está en x = 3, y = —2, de modo que la elipse se trasladó fuera de la posición están- 
dar 3 unidades hacia la derecha y 2 unidades hacia abajo. Su gráfica se muestra en la fi- 
gura 5.16. 


Figura 5.16 


Una elipse trasladada 


Si una ecuación cuadrática contiene un término en xy, entonces representa una có- 
nica que se rotó. 


Ejemplo 5.32 


Identifique y grafique de la cónica cuya ecuación es 
5x? + 4xy + 2y? =6 


Solución Fl lado izquierdo de la ecuación es una forma cuadrática, de modo que puede 
escribirla en forma matricial como x"Ax = 6, donde 


HA 
A= 
2 2 
En el ejemplo 5.27 se encontró que los eigenvalores de A son 6 y 1, y una matriz Q que 
diagonaliza ortogonalmente a A es 
gs ln v5 1/5 | 
1/ V5 =2/V5 
Observe que det Q = —1. En este ejemplo se intercambiarán las columnas de esta matriz 
para hacer el determinante igual a +1. Entonces Q será la matriz de una rotación, por el 


ejercicio 28 de la sección 5.1. Siempre es posible reordenar las columnas de una matriz 
ortogonal Q para hacer su determinante igual a +1. (¿Por qué?) En vez de ello, establezca 


Las ivel 


de modo que 
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Figura 5.17 


Una elipse rotada 


El cambio de variable x = Qx’ convierte la ecuación dada en la forma (x)"Dx' = 6 


, 


mediante una rotación. Si x’ = | | entonces esta ecuación es justo 


, 


(xY +óoy)=6 o Er + (y) =1 


que representa una elipse en el sistema coordenado x'y”. 
Para graficar esta elipse, es necesario conocer cuáles vectores desempeñan el papel de 


1 0 
e, = A y e, = | | en el nuevo sistema coordenado. (Estos dos vectores localizan las 


posiciones de los ejes x' y y”.) Pero, a partir de x = Qx', se tiene 


o Ls vello)" Lopvs 


o vallal = Lisl 


Éstas son las columnas q, y q, de Q, ¡que son los eigenvectores de A! El hecho de que 
estos vectores sean ortonormales concuerda perfectamente con el hecho de que el cam- 
bio de variable es justo una rotación. La gráfica se muestra en la figura 5.17. | 


Ahora puede ver por qué se llama así al teorema de los ejes principales. Si una matriz 
simétrica real A surge como la matriz de coeficientes de una ecuación cuadrática, los ei- 
genvectores de A ofrecen las direcciones de los ejes principales de la gráfica correspon- 
diente. 

Es posible que la gráfica de una cónica esté tanto rotada como trasladada fuera de la 
posición estándar, como se ilustra en el ejemplo 5.33. 


Identifique y grafique la cónica cuya ecuación es 


5x? + 4xy + 2y? 7 x 5 + 

ET T 
Solución La estrategia es eliminar primero el término en xy. En forma matricial, la 
ecuación es x"Ax + Bx + 4 = 0, donde 


ai 2] A | 28 A 

2 2 v5  v5 

El término en xy proviene de la forma cuadrática x"Ax, que se diagonaliza como en el 
ejemplo 5.32 al establecer x = Qx”, donde 


Las isl 


4=0 


Entonces, como en el ejemplo 5.32, 

xXAx = (x")"Dx' = (xy + 6(y Y 
Pero ahora también se tiene 

28 4 | 1/V5 a ll 
Vs vall-2/V3 1/v5)l y 


Bx = BQx' | 
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Figura 5.18 


Por tanto, en términos de x' y y”, la ecuación dada se convierte en 
yy 
(xY + 6(y Y? — 4x' — 12y +4=0 


Para llevar a la posición estándar la cónica representada por esta ecuación, es necesario 
trasladar los ejes xy”. Esto se hace al completar los cuadrados, como en el ejemplo 5.31. 
Se tiene 


(x) — ax +4) + 6((y) —- 24 +1) =-4+4+6=6 
o (x — 2) + 6(y' - 1) =6 
Esto produce las ecuaciones de traslación 

xX=xY-2 yl y =yY-1 
En el sistema coordenado x”y”, la ecuación es simplemente 


(MY + yy =6 


que es la ecuación de una elipse (como en el ejemplo 5.32). Esta elipse se puede bosque- 
jar al rotar primero y luego trasladar. La gráfica resultante se muestra en la figura 5.18. 


md 


La forma general de una ecuación cuadrática con tres variables x, y y z es 
ax? + by? + cz’ + dxy + exz + fyz + gx + hy +iz+j=0 


donde al menos uno de a, b, . . . , f es distinto de cero. La gráfica de tal ecuación cuadrá- 
tica se llama superficie cuádrica (o cuádrica). Nuevamente, para reconocer una cuá- 
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2 2 


Elipsoide: 5 + % +5 = 1 Hiperboloide de una hoja: o 
P “a B'e E a P c 
z Zz 
y 
y 
x 
x 
2 2 2 2 2 
Hiperboloide de dos hojas: 2 + 7 — 5 =-1 Cono elíptico: z2? = 2 $ > 
Z z 
y Ñ 
A LSZ Ri 
” hZ F 7 
X x a 
; PEN 2 y Sas P 2 y 
Paraboloide elíptico: z = z2 + 7 Paraboloide hiperbólico: z = 2 


LA 


E 


SL 


Ñ 
N 


\ 
\ 


\ 


x 


Figura 5.19 


Superficies cuádricas 
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drica es necesario ponerla en posición estándar. En la figura 5.19 se muestran algunas 
cuádricas en posición estándar; otras se obtienen al permutar las variables. 


Ejemplo 5.34 


Identifique la superficie cuádrica cuya ecuación es 


5x? + 11y? + 22? + 16xy + 20xz — 4yz = 36 


Solución La ecuación puede escribirse en forma matricial como x"Ax = 36, donde 


5 8&8 10 
A=| 8 11 -2 
10 —2 2 


Se encuentra que los eigenvalores de A son 18, 9 y —9, con sus correspondientes eigen- 
vectores ortogonales 


2 1 2 
a y E 
1 2 -2 


respectivamente. Al normalizarlos se obtiene 


2 1 2 
Ei 3 E] 
=|2 2 = | —1 
q |3p Q% = 3 y q; 3 
1 2 —2 
3 3 3 
y forman la matriz ortogonal 
2 1 2 
3 3 3 
Z =|2 2 _1 
Q=[q 4% q]=|5 3 3 
1 2 _2 
3 3 3 


Note que, con la finalidad de que Q sea la matriz de una rotación, se requiere que det Q 
= 1, lo que es verdadero en este caso. (De otro modo, det Q = —1 y el intercambio de 
dos columnas modifica el signo del determinante.) Por tanto, 


18 0 0 
QUO=D=| 0 9 0 
=9 


18(x')? + Ay? — 92) =36 o + 1 


A partir de la figura 5.19, esta ecuación se reconoce como la de un hiperboloide de una 
hoja. Los ejes x”, y” y Z’ están en las direcciones de los eigenvectores q}, q, y q, respecti- 
vamente. La gráfica se muestra en la figura 5.20. 
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Figura 5.20 


Un hiperboloide de una hoja en 


posición no estándar 


También puede identificar y graficar cuádricas que se hayan trasladado fuera de la 
posición estándar usando el “método de completar cuadrados” de los ejemplos 5.31 y 
5.33. Se le pedirá hacerlo en los ejercicios. 


lejercicios 5.5 
Y 


Códigos duales 01110 
En los ejercicios 1-4, G es una matriz generadora para un có- 7.P=|1 1 0 0 1 
digo C. Lleve G a forma estándar y determine si el código co- 0 0 1 1 1 
rrespondiente es igual a C. o | 0.1.0 y 
E 2 l1 0.01 
1 0 1 0 0 
1.G=|1 1 2.G=|0 1 1 
1 0 1 1 0 
0 0 1 En los ejercicios 9-12, encuentre el código dual C* del código C. 
0 1 1 0 0 
i 1 1 9.C= 0j, |1 
3. G= 4.G=|1 0 0 0 
Tr? 0 0 0 1 0 1 
1 1 1 
1 0 10. C = ANC) 
A ; ; 0 0 1 1 
En los ejercicios 5-8, P es una matriz de control de paridad 
digo C. Lleve P á ine si 0 0 0 0 
para un código C. Lleve P a forma estándar y determine si el 
código correspondiente es igual a C. 11.C= 0 1 1 0 
1 101 ` opoplopo 
5.P=[1 1 0] 6. P = 
1.1.1.1 0 0 1 1 


12.C= 


o ooo oo 
ST 
O =- O O m. 
=. it 


En los ejercicios 13-16, se proporciona una matriz generadora 
G o una matriz de verificación de paridad P para un código C. 
Encuentre una matriz generadora G% y una matriz de control 
de paridad P* para el código dual de C. 


1 0 
1 1 
0 1 
1 1 
13. G = 14.G=|1 0 
1 0 
1 1 
0 1 
0 1 
1 0 1 1 0 
1 1 1 0 
15. P = 16 P=|0 1 0 O 1 
0O 1 0 1 
0 0 1 0 1 


17. Encuentre las matrices generadora y de control de pari- 
dad para el dual del código de Hamming (7, 4) del 
ejemplo 3.71. 


El código de paridad par E, es el subconjunto de Z} que con- 
siste de todos los vectores con peso par. El código de repetición 
n-veces Rep,, es el subconjunto de Z que consiste sólo de dos 
vectores 0 y 1 (todos ceros y todos 1, respectivamente). 
18. (a) Encuentre las matrices generadora y de verificación 
de paridad para E, y Rep;. 
(b) Demuestre que E, y Rep, son duales mutuamente. 
19. Demuestre que E, y Rep, son duales mutuamente. 
20. Si Cy D son códigos y C C D, demuestre que D+ C 
a 
21. Demuestre que, si C es un código con una matriz gene- 
radora, entonces (C+)+ = C. 


22. Encuentre un código autodual de longitud 6. 


En los ejercicios 23-28, evalúe la forma cuadrática f(x) = 
x"Ax para los A y x dados. 


12 3 x 
mafe Jaf 
3 4 y 
1 
ma Mela 
p <=] X% 
3 —2 1 
sal 2 i 
L=2 4 6 
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1 0 -3 x 
26. A = 0 2 1|x=]|y 
=3 I 3 z 
1.0 =3 2 
27. A = 0 2 1|x=|-—1 
=3 1 3 1 


En los ejercicios 29-34, encuentre la matriz simétrica A aso- 
ciada con la forma cuadrática dada. 


29. x? + 2x3 + 6x,%, 
31. 3x? — 3xy — y 
33. 5x? — x2 + 2x2 + 2x% — 40x3 + 4x,%3 


34. 2x? — 3y? + 2 — 4xz 


30. xX% 


32. x? — x3 + 8x,Xx, — 6x,xXy 


Diagonalice las formas cuadráticas de los ejercicios 35-40 al 
encontrar una matriz ortogonal Q tal que el cambio de varia- 
ble x = Qy transforme la forma dada en una sin términos xy. 
Proporcione Q y la nueva forma cuadrática. 


35. 2x? + 5x3 — 4x% 36. x° + 8xy + y? 
37. 7x? + x2 + x2 + 8x,%, + 8x1% 
38. x? + x? + 3x2 — 4x,%, 

39. x? + z? — 2xy + 2yz 

40. 2xy + 2xz + 2yz 


16x,x3 


Clasifique cada una de las formas cuadráticas de los ejercicios 
41-48 como definida positiva, semidefinida positiva, definida 
negativa, semidefinida negativa o indefinida. 


41. x? + 20% 42. x? + x — 2x% 

43. —2x° — 2y? + 2xy 44. x° + y? + 4xy 

45. 2x? + 2x3 + 2x7 + 2x% + 2x,%, + 2%% 
Aba ta ta tion Ana + 3x3 + dxx, 


48. =x? — y? — z? — 2xy — 2xz — 2yz 


49. Demuestre el Teorema 5.24. 


50. Sea A = | | una matriz simétrica de 2 X 2. 


a 
b d 
Demuestre que A es definida positiva si y sólo si a > 0 y 
det A > 0. [Sugerencia: ax? + 2bxy + dy? = 


by? P\ 
a( +2) +(a-L), .)] 


51. Sea B una matriz invertible. Demuestre que A = BB es 
definida positiva. 
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52. Sea A una matriz simétrica definida positiva. Demuestre 
que existe una matriz invertible B tal que A = B*B. [Su- 
gerencia: use el teorema espectral para escribir A = 
QDQ". Luego demuestre que D puede factorizarse como 
C*C para alguna matriz invertible C.] 

53. Sean A y B matrices simétricas definidas positivas de 
n X n, y sea c un escalar positivo. Demuestre que las si- 
guientes matrices son definidas positivas. 

(a) cA (b) 4? (c) A+B 
(d) A”? (Primero demuestre que A necesariamente es 
invertible.) 

54. Sea A una matriz simétrica definida positiva. Demues- 
tre que existe una matriz simétrica definida positiva B tal 
que A = B?. (Tal matriz B se llama raíz cuadrada de A.) 


En los ejercicios 55-58, encuentre los valores máximo y mí- 
nimo de la forma cuadrática f(x) en el ejercicio dado, sujeta a 
la restricción |x| = 1 y determine los valores de x para los 
cuales esto ocurre. 


55. Ejercicio 42 56. Ejercicio 44 
57. Ejercicio 45 58. Ejercicio 46 
59. Termine la demostración del Teorema 5.25(a). 


60. Demuestre el Teorema 5.25(c). 


En los ejercicios 61-66, identifique la gráfica de la ecuación 
dada. 


61.x? + 5y? = 25 
63.x?-y-1=0 
65. 3x? = y? — 1 


62.x?-y?-4=0 
64.2x? + y? -8=0 
66. x = —2y? 


En los ejercicios 67-72, use una traslación de ejes para poner la 
cónica en posición estándar. Identifique la gráfica, proporcione 
su ecuación en el sistema coordenado trasladado y bosqueje la 
curva. 


67. x + y? — 4x —4y+4=0 

68. 4x? + 2y? — 8x + 12y +6 =0 

69. 9x? — 4y? — 4y = 37 70. x? + 10x — 3y = —13 
71.2y? + 4x + 8y =0 

72. 2y? — 3x? — 18x — 20y + 11 = 0 


En los ejercicios 73-76, use una rotación de ejes para poner la 
cónica en posición estándar. Identifique la gráfica, proporcione 
su ecuación en el sistema coordenado rotado y bosqueje la 
curva. 

73. x + xy +y =6 74. 4x? + 10xy + 4y? =9 

75. 4x? + 6xy — 4y? =5 76.3x? — 2xy + 3y? = 8 


En los ejercicios 77-80, identifique la cónica con la ecuación 
dada y proporcione su ecuación en forma estándar. 


77.3x? — 4xy + 3y? — 28V2x + 22V2y + 84 =0 
78. 6x? — 4xy + 9y? — 20x — 10y -5 = 0 

79. 2xy + 2V2x-1=0 

80. x? — 2xy + y? + 4V2x—4=0 


En ocasiones, la gráfica de una ecuación cuadrática es una 
recta, un par de rectas o un solo punto. A tales gráficas 

se les conoce como cónica degenerada. También es posible 
que la ecuación no se satisfaga con valor alguno de las 
variables, en cuyo caso no existe gráfica en absoluto y a 

la cónica se le conoce como cónica imaginaria. En los ejerci- 
cios 81-86, identifique la cónica con la ecuación dada o 
como degenerada o como imaginaria y, donde sea posible, 
bosqueje la gráfica. 

81. x’ —y?=0 82. x? +2y+2=0 

83. 3x? + y?=0 84. x? +2xy+y?=0 
85. x? — 2xy + y? + 2V2x — 2V2y = 0 

86. 2x? + 2xy + 2y? + 2V2x — 2V2y +6 =0 


87. Sea A una matriz simétrica de 2 X 2 y sea k un escalar. 
Demuestre que la gráfica de la ecuación cuadrática 
x Ax = kes 
(a) una hipérbola si k # 0 y det A < 0 
(b) una elipse, circunferencia o cónica imaginaria si 
k#0ydetA>0 
(c) un par de rectas o una cónica imaginaria si k 4 0 y 


detA = 0 
(d) un par de rectas o un solo punto si k = 0 y det 
AFO 


(e) una recta si k = 0 y det A = 0 [Sugerencia: use el 
teorema de ejes principales. ] 


En los ejercicios 88-95, identifique la cuádrica con la ecuación 
dada y proporcione su ecuación en forma estándar. 


88. 4x? + 4y? + 42? + 4xy + 4xz + 4yz = 8 

89. x? + y? + 22—4yz= 1 

90. =x? — y? — z? + 4xy + 4xz + 4yz = 12 

91.2xy +z=0 

92. 16x? + 100y? + 92? — 24xz — 60x — 80z = 0 
93. x? + y? — 22% + 4xy — 2x2 + 2yz=x+y+z=0 


94. 10x? + 25y? + 102? — 40xz + 20W2x + 50y + 
20V2z = 15 


95. 11x? + 11y? + 142? + 2xy + 8xz — 8yz — 12x + 
12y + 122 =6 
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96. Sea A una matriz real de 2 X 2 con eigenvalores comple- es invertible y A = e| a =b | PL Establezca B = 
jos à = a bi tales que b + 0y |A| = 1. Demuestre a 
que toda trayectoria del sistema dinámico X; +, = AX, se 
encuentra sobre una elipse. [Sugerencia: el Teorema 4.43 (PP2)*, Demuestre que la cuadrática x"Bx = k define 
muestra que si v es un eigenvector correspondiente a una elipse para toda k > 0 y pruebe que si x está sobre 
A = a — bi, entonces la matriz P = [Rev Im v] dicha elipse, también lo hace Ax.] 


Definiciones y conceptos clave 


base ortogonal, 381 factorización QR, 404 proyección ortogonal, 393 
base ortonormal, 383 matriz ortogonal, 385 subespacios fundamentales de una 
complemento ortogonal de un matriz diagonalizable ortogonalmente, matriz, 391 
subespacio, 389 411 teorema de descomposición ortogonal, 
conjunto ortogonal de vectores, 380 proceso de Gram-Schmidt, 400 395 
conjunto ortonormal de vectores, 383 propiedades de las matrices teorema del rank, 397 
descomposición espectral, 416 ortogonales, 386-387 teorema espectral, 414 
Preguntas de repaso 7 
1. Marque cada uno de los siguientes enunciados como 3. Encuentre el vector coordenado [v]s de v = | =3 
verdadero o falso: 2 
(a) Todo conjunto ortonormal de vectores es lineal- con respecto a la base ortogonal 
mente independiente. 
(b) Todo subespacio distinto de cero de R” tiene una 1 1 E 
base ortogonal. B= ol, 1Ll 21 der? 
(c) Si A es una matriz cuadrada con renglones ortonor- 
males, entonces A es una matriz ortogonal. l E 
(d) Toda matriz ortogonal es invertible. 
(e) Si A es una matriz con det A = 1, entonces A es una 4. El vector coordenado de un vector v con respecto a una 
matriz ortogonal. —3 
(f) Si A es una matriz de m X n tal que (renglón(A))* base ortonormal B = {v, v,) de R? es [v]; = | E 


= R”, entonces A debe ser la matriz cero. 
(g) Si W es un subespacio de R” y v es un vector en R” 


; 3/5 a 
Siv, = „encuentre todos los posibles vectores v. 
tal que proy,y(v) = 0, entonces v debe ser el vector l 4/5 


cero. 
(h) Si A es una matriz ortogonal simétrica, entonces 6/7 2/7 3/7 
£=]. 5. Demuestre que | —1/V5 0 2/V5 | es 
(i) er diagonalizable ortogonalmente es in- 4/7V5  -15/7V5 2/7V5 
vertible. 
(j) Dados cualesquiera números reales n, A, ..., Ay una matriz ortogonal, 
existe una matriz simétrica de n X n 
con Àp ..., A, como sus eigenvalores. 6. Si | - al es una matriz ortogonal, encuentre 


2. Encuentre todos los valores de a y b tales que 


1 4| ja todos los posibles valores de a, b y c. 
2 |>| 1|,|b|¿ esun conjunto ortogonal de 7. Si Q es una matriz ortogonal den X n y {V}... Vg} 
3 =2] 63 es un conjunto ortonormal en R”, demuestre que 


vectores. [Qv;, ..., Qv;) es un conjunto ortonormal. 


444 Capítulo 5 Ortogonalidad 


8. Si Q es una matriz de n X n tal que los ángulos Z (Qx, 
Qy) y 4(x y) son iguales para todos los vectores x y y 
en R”, pruebe que Q es una matriz ortogonal. 


En las preguntas 9-12, encuentre una base para W+. 


9. Wes la recta en R? con ecuación general 2x — 5y = 0 


10. W es la recta en R? con ecuaciones paramétricas 


== 
y= 2t 
a 
1 0 16 
11. W = gen =1 1 
4 =9 
1 1 
12. W = gen i 3 = 
J 1 17 
1 2 


13. Encuentre bases para cada uno de los cuatro subespa- 
cios fundamentales de 


1 —1 2 1 3 


jaji 22 12 
2 1 4 8 9 18 
ep al y 


l 19. 
0 
v= 
=] 
2 
con respecto a 
0 3 
20. 
1 0 1 
W = gen : , 
1 1 =2 
1 =1 1 


15. (a) Aplique el Proceso de Gram-Schmidt a 


> = 


= = = O 


para encontrar una base ortogonal para 
W = gen {X}, X» X3}. 


(b) Use el resultado del inciso (a) para encontrar una 


1 1 0 
factorización QR de A = pa 
1.1 1 
1 0 1 
. Encuentre una base ortogonal para [R* que contenga los 
1 0 
0 1 
vectores |, |Y 1 
2 —1 
. Encuentre una base ortogonal para el subespacio 
Xi 
W= o FAM + x + x = 0? de R. 
3 
X4 
2 1 SI 
. Sea A = 1 2 1 
=L i 2 


(a) Diagonalice ortogonalmente A. 
(b) Proporcione la descomposición espectral de A. 


Encuentre una matriz simétrica con eigenvalores A, = 
A, = 1,4, = —2 y elgenespacios 
1 1 1 
E, = gen L |, [1 ,E_, = gen =] 
0 1 0 
Si {Vi V» ..-, Va} es una base ortonormal para R” y 


A= cvv? + AAS ere Cv Y 


demuestre que A es una matriz simétrica con eigenvalo- 
TeS Ci, C» ..., €, y correspondientes eigenvectores 
Vip Va +. > Vy 


El álgebra es generosa; con 
frecuencia da más de lo que pide. 
-Jean le Rond d'Alembert 
(1717-1783) 
En Carl B. Boyer, 
A History of Mathematics, 
WILEY, 1968, P. 481 


6.0 Introducción: Fibonacci en el espacio 
(vectorial) 


La sucesión de Fibonacci se introdujo en la sección 4.6. Es la sucesión 
0, 1,.1,2,,3,0,:8, 13554. 
de enteros no negativos con la propiedad de que, después de los primeros dos términos, 
cada término es la suma de los dos términos que lo anteceden. Por tanto, 0 + 1 = 1,1 + 1 
=2,1+2=3,2+ 3 = 5, etcétera. 
Si los términos de la sucesión de Fibonacci se denotan por fo fi» f» . . . , entonces toda 
la sucesión está completamente determinada al especificar que 


f=0f =1 y £= fi +f 2, Pparan=2 
Por analogía con la notación vectorial, se escribe una sucesión Xy, X1» X,, Xy, . . . COMO 
X= [Xp Xi, Xy) Xp) 
Entonces la sucesión de Fibonacci se convierte en 


f= fofo faf.) =1[0,1,1,2,...) 


Ahora se generaliza esta noción. 


Definición Una sucesión tipo Fibonacci es cualquier sucesión x = [xp xp X» X3 
. +») tal que x, y x, son números reales y x, = X,, 1 + X,_, para n = 2. 


Por ejemplo, [1, V2, 1 + V2, 1 + 2V2,2 + 3V2,...) es una sucesión tipo Fibonacci. 

Problema 1 Escriba los primeros cinco términos de otras tres sucesiones tipo Fibo- 
nacci. Nuevamente por analogía con los vectores, defina la suma de dos sucesiones x = [xo 
Xp X» +. .) YY = [Yo Yo Yo - - -) como la sucesión 


xi [Xp + Yo X += o T Yos) 


Si ces un escalar, del mismo modo se puede definir el múltiplo escalar de una sucesión me- 
diante 


cx lacio...) 
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La sucesión de Lucas recibe su 
nombre en honor de Edouard 
Lucas (vea la página 347). 


Problema 2 (a) Con los ejemplos del problema 1 u otros, calcule las sumas de va- 
rios pares de sucesiones tipo Fibonacci. ¿Las sucesiones resultantes 
parecen ser del tipo Fibonacci? 


(b) Calcule varios múltiplos escalares de sus sucesiones tipo Fibonacci 
del problema 1. ¿Las sucesiones resultantes parecen ser tipo Fi- 
bonacci? 

Problema 3 (a) Demuestre que si x y y son sucesiones tipo Fibonacci, entonces tam- 
bién lo es x + y. 


(b) Demuestre que si x es una sucesión tipo Fibonacci y c es un escalar, 
entonces cx también es una sucesión tipo Fibonacci. 

Denote con Fib al conjunto de todas las sucesiones tipo Fibonnaci. El problema 3 
muestra que, como R”, Fib es cerrado para la suma y multiplicación escalar. Los siguien- 
tes ejercicios muestran que Fib tiene mucho más en común con R”. 

Problema 4 Revise las propiedades algebraicas de los vectores en el Teorema 1.1. ¿Fib 
satisface todas las propiedades? ¿Cuál sucesión tipo Fibonacci desempaña el papel de 0? 
Para una sucesión tipo Fibonacci x, ¿cuál es —x? ¿-x también es una sucesión tipo Fibo- 
nacci? 

Problema 3 En R” se tienen los vectores base estándar e}, €,, . . ., €, La sucesión de 
Fibonacci f = [0, 1, 1, 2, . . .) puede considerarse como el análogo de e, porque sus pri- 
meros dos términos son 0 y 1. ¿Qué sucesión e en Fib tiene el papel de e? 

Problema 6 Seax = [x xX X% . . .) una sucesión tipo Fibonacci. Demuestre que x es 
una combinación lineal de e y f. 

Problema 7 Demuestre que e y f son linealmente independientes. (Esto es, demues- 
tre que, si ce + df = 0, entonces c = d = 0.) 

Problema 8 Dadas sus respuestas a los problemas 6 y 7, ¿cuál sería un valor sensible 
para asignar a la “dimensión” de Fib? ¿Por qué? 

Problema 9 ¿Existen algunas sucesiones geométricas en Fib? Esto es, si 


[11,12 T e) 


es una sucesión tipo Fibonacci, ¿cuáles son los posibles valores de r? 

Problema 10 Encuentre una “base” para Fib que consista de sucesiones geométricas 
tipo Fibonacci. 

Problema 11 Con su respuesta al problema 10, ofrezca una deducción alternativa de 
la fórmula de Binet [fórmula (5) de la sección 4.6]: 


2 {=y {=y 
ETE v5\ 2 


para los términos de la sucesión de Fibonacci f = [fy f f,.. .).[Sugerencia: exprese f en 
términos de la base del problema 10.] 


La sucesión de Lucas es la sucesión tipo Fibonacci 
1= [h l bb...) =[2,1,3,4,....) 


Problema 12 Use la base del problema 10 para encontrar un análogo de la fórmula 
de Binet para el n-ésimo término 1, de la sucesión de Lucas. 

Problema 13 Demuestre que las sucesiones de Fibonacci y de Lucas se relacionan 
mediante la identidad 


tii t farı = hn paran = 1 
[Sugerencia: las sucesiones tipo Fibonacci f = [1, 1,2, 3,.. yf = [1,0,1,1,...) for- 
man una base para Fib. (¿Por qué?)] 

En esta introducción se vio que la colección Fib de todas las sucesiones tipo Fibo- 
nacci se comportan en muchos aspectos como R?, aun cuando los “vectores” en realidad 
son sucesiones infinitas. Esta útil analogía conduce a la noción general de un espacio vec- 
torial que es el tema de este capítulo. 


Por lo general, al matemático 
alemán Hermann Grassmann 
(1809-1877) se le acredita la intro- 
ducción de la idea de un espacio 
vectorial (aunque él no lo llamó de 
esa forma) en 1844. Por desgracia, 
su obra es muy difícil de leer y no 
recibe la atención que merece. Una 
persona que lo estudió fue el 
matemático italiano Giuseppe Peano 
(1858-1932). En su libro de 1888, 
Calcolo Geometrico, Peano clarificó 
la obra temprana de Grassmann y 
tendió los axiomas para un espacio 
vectorial como se le conoce en la ac- 
tualidad. El libro de Peano también 
es notable por introducir las opera- 
ciones con conjuntos. Sus nota- 
ciones U, A y E (para “unión”, “in- 
tersección” y “es un elemento de”) 
son las que se utilizan hoy día, 
aunque otros matemáticos no las 
aceptaron de inmediato. La defini- 
ción axiomática de Peano de espacio 
vectorial también tuvo poca influen- 
cia durante muchos años. La 
aceptación llegó en 1918, después de 
que Hermann Weyl (1885-1955) lo 
repitiera en su libro Space, Time, 
Matter, una introducción a la teoría 
de la relatividad general de Einstein. 
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Espacios y subespacios vectoriales 


En los capítulos 1 y 3 se vio que el álgebra de vectores y el álgebra de matrices son simi- 
lares en muchos aspectos. En particular, es posible sumar tanto vectores como matrices, 
y ambos pueden multiplicarse por escalares. Las propiedades que resultan de estas dos 
operaciones (Teorema 1.1 y Teorema 3.2) son idénticas en ambos escenarios. En esta sec- 
ción se usan dichas propiedades para definir “vectores” generalizados que surgen en una 
gran variedad de ejemplos. Al probar teoremas generales acerca de dichos “vectores”, se 
probarán simultáneamente resultados acerca de todos esos ejemplos. Este es el verdadero 
poder del álgebra: su habilidad para tomar propiedades de un escenario concreto, como 
R”, y abstraerlas a un escenario general. 


Definición Sea Vun conjunto sobre el cual se definen dos operaciones, llamadas 
suma y multiplicación por un escalar. Si u y v están en V, la suma de u y v se denota 
mediante u + v, y si ces un escalar, el múltiplo escalar de u por c se denota mediante 
cu. Si los siguientes axiomas se cumplen para todos u, v y w en V y para todos los es- 
calares c y d, entonces V se llama espacio vectorial y sus elementos se llaman vectores. 


1. u + v está en V. Cerradura bajo la suma 
2u+tv=v+u Conmutatividad 
3. (u +v) +w=u+(v+w) Asociatividad 
4. Fxiste un elemento 0 en V, llamado vector cero, tal que u + 0 = u. 
5. Para cada u en V, existe un elemento —u en V tal que u + (—u) = 0. 
6. cu está en V. Cerradura bajo multiplicación escalar 
7. c(u + v) = cu + cv Distributividad 
8. (c + d)u = cu + du Distributividad 
9. c(du) = (cd)u 
10. lu = u 
Comentarios 


e Por “escalares” usualmente se entenderán los números reales. En concordancia, 
debe referirse a V como a un espacio vectorial real (o un espacio vectorial sobre los números 
reales). También es posible que los escalares sean números complejos o que pertenezcan a 
Z donde p es primo. En esos casos, V se conoce como espacio vectorial complejo o espacio 
vectorial sobre Z „ respectivamente. La mayoría de los ejemplos serán espacios vectoriales 
reales, de modo que por lo general se omitirá el adjetivo “real”. Si a algo se le refiere como 
“espacio vectorial”, suponga que trabajará en el sistema de números reales. 

De hecho, los escalares pueden elegirse de cualquier sistema numérico en el que, dicho 
burdamente, puede sumar, restar, multiplicar y dividir de acuerdo con las leyes usuales de 
la aritmética. En álgebra abstracta, a tal sistema numérico se le conoce como campo. 

e La definición de espacio vectorial no especifica en qué consiste el conjunto V. 
Tampoco especifica cómo son las operaciones llamadas “suma” y “multiplicación por un 
escalar”. Con frecuencia, serán familiares, pero no necesitan serlo. Vea el ejemplo 6.6 y los 
ejercicios 5-7. 


Ahora observará varios ejemplos de espacios vectoriales. En cada caso, es necesario 
especificar el conjunto V y las operaciones de suma y multiplicación por un escalar y ve- 
rificar los axiomas 1 a 10. Es necesario poner particular atención a los axiomas 1 y 6 (ce- 
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rradura), axioma 4 (la existencia de un vector cero en V) y el axioma 5 (cada vector en V 
debe tener un negativo en V). 


Ejemplo 6.1 


> 
Para cualquier n = 1, R” es un espacio vectorial con las operaciones usuales de suma y 
multiplicación por un escalar. Los axiomas 1 y 6 son consecuencia de las definiciones de 
dichas operaciones y los axiomas restantes se deducen del Teorema 1.1. 


Ejemplo 6.2 


2 
El conjunto de todas las matrices de 2 X 3 es un espacio vectorial con las operaciones 
usuales de suma matricial y multiplicación escalar matricial. Aquí los “vectores” en reali- 
dad son matrices. Se sabe que la suma de dos matrices de 2 X 3 también es una matriz de 
2 X 3 y que al multiplicar una matriz de 2 X 3 por un escalar produce otra 
matriz de 2 X 3; por tanto, se tiene cerradura. Los axiomas restantes se deducen del Teo- 
rema 3.2. En particular, el vector cero 0 es la matriz cero de 2 X 3, y el negativo de una ma- 
triz A de 2 X 3 es justo la matriz —A de 2 X 3. 

No hay nada especial acerca de las matrices de 2 X 3. Para cualesquiera enteros po- 
sitivos m y n, el conjunto de todas las matrices de m X n forma un espacio vectorial con 
las operaciones usuales de suma matricial y multiplicación escalar matricial. Este espa- 


cio vectorial se denota M „n: 


> 


Sea P, el conjunto de todos los polinomios de grado 2 o menor con coeficientes reales. 
Defina la suma y multiplicación por un escalar en la forma usual. (Vea el Apéndice D.) Si 


px)=a)+ax+ax y  q(x)=b,+ bx + b,x? 
están en P,, entonces 
p(x) + q(x) = (m + bo) + (a, + bi)x + (a, + b,)x? 
tiene cuando mucho grado 2 y por tanto está en %W,. Si c es un escalar, entonces 
cp(x) = ca, + cayx + cazx? 


también está en P.. Esto verifica los axiomas 1 y 6. 

El vector cero 0 es el polinomio cero; esto es, el polinomio cuyas entradas son todas 
cero. El negativo de un polinomio p(x) = a, + a,x + a,x? es el polinomio —p(x) = —a, 
— a,x — a,x?. Ahora es fácil verificar los axiomas restantes. Se comprobará el axioma 2 y 
se dejarán los otros para el ejercicio 12. Con los anteriores p(x) y q(x), se tiene 


p(x) + q(x) = (a, + ax + ax’) + (by + bix + bx?) 
= (at by) + (a, + bx + (a, + baja? 
= (by + a) + (b; + a)x + (b, +0) 
= (by + bix + bx’) + (a, + ax + ax’) 
= q(x) + p(x) 


donde la tercera igualdad es consecuencia del hecho de que la suma de números reales es 


conmutativa. 


Sección 6.1 Espacios y subespacios vectoriales 449 


En general, para cualquier n = 0 fijo, el conjunto P, de todos los polinomios de 
grado menor o igual a n es un espacio vectorial, como lo es el conjunto P de todos los po- 
linomios. 


> 


Ejemplo 6.4 


Sea F el conjunto de todas las funciones con valor real definidas en la recta numérica. Si 
fy g son dos de tales funciones y c es un escalar, entonces f + g y cf están definidos por 


+ gd) =f +80) y (96) = f(x) 


En otras palabras, el valor de f + g en x se obtiene al sumar los valores de f y g en x [fi- 
gura 6.1(a)]. De igual modo, el valor de cfen x es justo el valor de fen x multiplicado por 
el escalar c [figura 6.1(b)]. El vector cero en F es la función constante f} que es idéntica- 
mente cero; esto es, f(x) = 0 para toda x. El negativo de una función f es la función —f 
definida por (—f) (x) = —f(x) [figura 6.1(c)]. 

Los Axiomas 1 y 6 obviamente son verdaderos. La verificación de los axiomas res- 
tantes se deja como ejercicio 13. Por tanto, F es un espacio vectorial. 


y y 
A 


(a, 20) 
fa) + 00) 


Figura 6.1 


Las gráficas de (a) f gyf + g (b) f£,2fy —3f y (c) fy -f 


(o =3f(0)) 
(a) (b) 

y 
A 

œ, f) 

ra 
>x 
(x, 0) 
ed 

(o, =f00) 

(c) 
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En el ejemplo 6.4 también podría considerar sólo aquellas funciones definidas en 
algún intervalo cerrado [a, b] de la recta real. Este planteamiento también produce un es- 
pacio vectorial denotado mediante Y a, b]. 


> 
El conjunto Z de enteros con las operaciones usuales no es un espacio vectorial. Para de- 
mostrar esto, es suficiente con encontrar que falla uno de los diez axiomas y dar un ejem- 
plo específico donde falle (un contraejemplo). En este caso, se descubre que no se tiene 
cerradura para la multiplicación por un escalar. Por ejemplo, el múltiplo del entero 2 por 
el escalar } es (3)(2) = 3, que no es entero. Por tanto, no es cierto que cx esté en Z para 
toda x en Z y todo escalar c (esto es, falla el axioma 6). 


> 
Sea V = R? con la definición usual de suma, pero la siguiente definición de multiplica- 
ción por un escalar: 


ntonces, por ejemplo, = 
onces, por ejemp 3 0 3 


de modo que falla el axioma 10. [De hecho, los otros nueve axiomas son todos verdade- 
ros (compruébelo), pero no es necesario sondear en ellos, porque V ya falló en ser un es- 
pacio vectorial. Este ejemplo demuestra el valor de anticiparse, en lugar de trabajar a lo 
largo de una lista de axiomas en el orden en el que se presentan. ] 


Ejemplo 6.7 


> 

Sea C? el conjunto de todos los pares ordenados de números complejos. Defina la suma 
J 

y la multiplicación escalar como en R?, excepto que aquí los escalares son números com- 


plejos. Por ejemplo, 
pa X E | E t] 
7 (= o - a p Ea) j pe a 


Al usar las propiedades de los números complejos, es directo comprobar que se sostie- 
nen los diez axiomas. Por tanto, C? es un espacio vectorial complejo. 


En general, C” es un espacio vectorial complejo para todo n = 1. 


> 
Si p es primo, el conjunto Z; (con las definiciones usuales de suma y multiplicación por 


escalares de Z,) es un espacio vectorial sobre Z, para todo n = 1. 
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Antes de considerar más ejemplos, se enuncia un teorema que contiene algunas pro- 
piedades útiles de los espacios vectoriales. Es importante notar que al demostrar este 
teorema para espacios vectoriales en general, en realidad se demuestra para todo espacio 
vectorial específico. 


Teorema 6.1 


Sea V un espacio vectorial, u un vector en V y c un escalar. 


a. 0u=0 
b. c0=0 
c. (—1)u = —u 


d. Sicu = 0, entonces c = 0 o u = 0. 


Demostración Se demuestran las propiedades (b) y (d) y se dejan las demostraciones 
de las propiedades restantes como ejercicios. 


(b) Se tiene 
c0 = c(0 + 0) = c0 + c0 


por los axiomas 4 y 7 de espacio vectorial. Al sumar el negativo de c0 a ambos lados se 
produce 


c0 + (—c0) = (c0 + c0) + (—c0) 
que implica 
0 = c0 + (c0 + (—c0)) por los axiomas 5 y 3 


=c0+0 por el axioma 5 


= c0 por el axioma 4 


(d) Suponga cu = 0. Para demostrar que c = 0 ou = 0, suponga que c # 0. (Sic = 0, 
no hay nada que probar.) Entonces, dado que c # 0, su recíproco 1/c está definido, y 


u= lu por el axioma 10 


Il 
TS: 
al- 
Aa 
sinn 
g 


(cu) por el axioma 9 


=0 por la propiedad (b) O m 


Se escribirá u — v para u + (—v), lo que por tanto define la resta de vectores. Tam- 
bién se explotará la propiedad de asociatividad de la suma para escribir sin ambigüeda- 
des u + v + w para la suma de tres vectores y, de manera más general, 


cUu + ou, +e + cu, 


para una combinación lineal de vectores. 


Ya vio que, en R”, es posible que un espacio vectorial se asiente dentro de otro, lo que da 
lugar a la noción de subespacio. Por ejemplo, un plano que pasa por el origen es un sub- 
espacio de R°. Ahora se extiende este concepto a espacios vectoriales en general. 
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Definición Un subconjunto W de un espacio vectorial V se llama subespacio de 
V si W es en sí mismo un espacio vectorial con los mismos escalares, suma y multi- 
plicación por un escalar que V. 


Como en R”, comprobar si un subconjunto W de un espacio vectorial V es un sub- 
espacio de V implica probar sólo dos de los diez axiomas de espacio vectorial. Esta ob- 
servación se demuestra como teorema. 


Teorema 6.2 


Sea V un espacio vectorial y sea W un subconjunto no vacío de V. Entonces W es un 
subespacio de V si y sólo si se cumplen las siguientes condiciones: 


a. Siu y v están en W, entonces u + v está en W. 
b. Si u está en W y c es un escalar, entonces cu está en W. 


Demostración Suponga que W es un subespacio de V. Entonces W satisface los axiomas 
1 a 10 de espacio vectorial. En particular, el axioma 1 es la condición (a) y el axioma 6 es 
la condición (b). 

Por el contrario, suponga que W es un subconjunto de un espacio vectorial V que sa- 
tisface las condiciones (a) y (b). Por hipótesis, los axiomas 1 y 6 se cumplen. Los axiomas 
2, 3,7, 8, 9 y 10 se sustentan en W porque son verdaderos para todos los vectores en V y 
por tanto son verdaderos en particular para aquellos vectores en W. (Se dice que W he- 
reda dichas propiedades de V.) Esto deja por probar los axiomas 4 y 5. 

Dado que W no está vacío, contiene al menos un vector u. Entonces la condición (b) 
y el Teorema 6.1(a) implican que 0u = 0 también está en W. Este es el axioma 4. 

Si u está en V, entonces, al tomar c = —1 en la condición (b), se tiene que —u = 
(— D)u también está en W, al usar el Teorema 6.1(c). — 


Comentario Dado que el Teorema 6.2 generaliza la noción de subespacio a partir 
del contexto de R” a espacios vectoriales en general, todos los subespacios de R” que se 
encontraron en el capítulo 3 son subespacios de R” en el contexto actual. En particular, 
las rectas y planos que pasan por el origen son subespacios de R°. 


> 
Ya se demostró que el conjunto Y, de todos los polinomios con grado n a lo más es un 
espacio vectorial. Por tanto, P „ es un subespacio del espacio vectorial P de todos los po- 


linomios. f 


Ejemplo 6.10 


q 
Sea W en conjunto de matrices simétricas de n X n. Demuestre que W es un subespacio 
de Mp: 


Solución Claramente, W no está vacío, así que sólo necesita demostrar las condiciones 
(a) y (b) en el Teorema 6.2. Sean A y B que están en W y sea c un escalar. Entonces AT= 
A yB" = B, de donde se tiene que 


(A+B) =A"+B"=A+B 
Por tanto, A + B es simétrica y, en consecuencia, está en W. De igual modo, 
(cA)" = cA" = cA 


de modo que cA es simétrica y, en consecuencia, está en W. Se demostró que W es cerrada 
para la suma y multiplicación por un escalar. Por tanto, es un subespacio de M,,,, por el 


Teorema 6.2. 
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> 


iS 


Ejemplo 6.11 


Sea € el conjunto de todas las funciones continuas con valor real definidas en R y sea Y 
el conjunto de todas las funciones derivables con valor real en R. Demuestre que € y Y 
son subespacios de %, el espacio vectorial de todas las funciones con valor real definidas 
en R. 


Solución Del cálculo se sabe que si f y g son funciones continuas y c es un escalar, en- 
tonces f + g y cf también son continuas. Por tanto, € es cerrado bajo la suma y la multi- 
plicación por un escalar y por tanto es un subespacio de F. Si f y g son derivables, en- 
tonces también lo son f + g y cf. De hecho, 


PESE y MESA) 


De modo que % también es cerrado para la suma y la multiplicación por un escalar, lo 


que lo hace un subespacio de F. 


Es un teorema del cálculo que toda función derivable es continua. En consecuencia, 
9 está contenido en  (denotado mediante Y C €), lo que hace a Y un subespacio de 
€. También es el caso de que toda función polinominal es derivable, de modo que P C %, 
así que P es un subespacio de D. Por tanto, se tiene una jerarquía de subespacios de F, 
uno dentro del otro: 


PEBCGCR 


Esta jerarquía se muestra en la figura 6.2. 


Figura 6.2 


La jerarquía de subespacios de F 


Existen otros subespacios de F que pueden colocarse en esta jerarquía. Algunos de 
ellos se exploran en los ejercicios. 

En la discusión anterior podría haberse restringido la atención a las funciones defi- 
nidas en un intervalo cerrado [a, b]. Entonces los subespacios correspondientes de F [a, 
b] serían la, b], Dla, b] y Pla, b]. 


Ejemplo 6.12 


Sea S el conjunto de todas las funciones que satisfacen la ecuación diferencial 
f'+f=0 a) 


Esto es, S es el conjunto solución de la ecuación (1). Demuestre que S es un subespacio 
de F. 
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En palabras de Yogi Berra: “Nueva- 
mente es déjà vu”. 


Solución S no está vacío, pues la función cero claramente satisface la ecuación (1). Sean 


f y g que están en S y sea c un escalar. Entonces 


Fte)" tUte) +8") +(f+g) 
=P +f) + (g" +8) 
=0+0 
=0 

lo que demuestra que f + g está en S. De igual modo, 
lef)” +f =ef" +<f 
= df’ +f) 
=c¢c0 
=0 


de modo que cf también está en S. 
Por tanto, S es cerrado para la suma y la multiplicación por un escalar y es un subes- 


pacio de F. | 


La ecuación diferencial (1) es un ejemplo de una ecuación diferencial lineal homo- 
génea. Los conjuntos solución de tales ecuaciones siempre son subespacios de F. Note 
que, en el ejemplo 6.12, en realidad no se resolvió la ecuación (1) (esto es, no se encon- 
traron soluciones específicas distintas a la función cero). En la sección 6.7 se analizarán 
técnicas para encontrar soluciones para este tipo de ecuación. 

Conforme obtiene experiencia al trabajar con espacios y subespacios vectoriales, no- 
tará que ciertos ejemplos tienden a parecerse entre sí. Por ejemplo, considere los espacios 
vectoriales [R*, P, y M),. Los elementos típicos de estos espacios vectoriales son, respec- 
tivamente, 


SAS 


y, p(x) =a+bx+ œ +d, y aal A 
d 


Cualquier cálculo que involucre las operaciones de espacio vectorial de suma y multipli- 
cación por un escalar es en esencia el mismo en los tres escenarios. Para destacar las si- 
militudes, en el siguiente ejemplo se realizarán los pasos necesarios en los tres espacios 
vectoriales lado por lado. 


Ejemplo 6.13 


(a) Demuestre que el conjunto W de todos los vectores de la forma 


es un subespacio de R*, 


(b) Demuestre que el conjunto W de todos los polinomios de la forma a + bx — bx? + 
ax? es un subespacio de P}. 


a b 
(c) Demuestre que el conjunto W de todas las matrices de la forma ll | es un 
subespacio de M.,. a 


Solución 


(a) W no es vacío porque contiene al 
vector cero 0. (Tome a = b= 0.) Sean 
u y v que están en W, por decir, 


a c 
b d 
u= p y v= _d 
a € 
Entonces 
atre 
TE b+d 
=b=d 
äte 
a+c 
z b+d 
| —(b+d) 
ate 


de modo que u + v también está en W 
(porque tiene la forma correcta). 

De igual modo, si k es un escalar, 
entonces 


ka 


de modo que ku está en W. 

Por tanto, W es un subconjunto no 
vacío de Rt que es cerrado bajo la 
suma y la multiplicación por un esca- 
lar. Por tanto, W es un subespacio de 
R4, por el Teorema 6.2. 
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(b) W no es vacío porque contiene el 
polinomio cero. (Tome a = b = 0.) 
Sean p(x) y q(x)que están en W, por 
decir, 


p(x) = a + bx — be + ax? 


y 
q(x) = c + dx — de + cx? 
Entonces 
px) + a(x) = (a + o) 
+ (b + dix 
= (b + d) 
+ (a + c) 


de modo que p(x) + q(x) también está 
en W (porque tiene la forma correcta). 

De igual modo, si k es un escalar, 
entonces 


kp(x) = ka + kbx — kbx? + kax? 


de modo que kp (x) está en W. 

Por tanto, W es un subconjunto no 
vacío de P, que es cerrado para la 
suma y la multiplicación por un esca- 
lar. Por tanto, W es un subespacio de 
P, por el Teorema 6.2. 
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(c) W no es vacío porque contiene la 
matriz O. (Tome a = b = 0.) Sean A y 
B en W, por decir, 


a=] a | 
=b a 
5 | č el 
y sg 6 
Entonces 
a+B=] a+c ste] 
=(b+d) a+c 


de modo que A + B también está en W 
(porque tiene la forma correcta). 

De igual modo, si k es un escalar, 
entonces 


ka El 
—kb ka 


n- 


de modo que kA está en W. 

Por tanto, W es un subconjunto no 
vacío de M,, que es cerrado para la 
suma y la multiplicación por un esca- 
lar. Por tanto, W es un subespacio de 


M» por el Teorema 6.2. | 


El ejemplo 6.13 muestra que con frecuencia es posible relacionar ejemplos que, en la 


superficie, parecen no tener algo en común. En consecuencia, puede aplicar su conoci- 
miento de R” a polinomios, matrices y otros ejemplos. Esta idea se encontrará muchas 
veces en este capítulo y se precisará en la sección 6.5. 


Ejemplo 6.14 


> 
Si V es un espacio vectorial, entonces V es claramente un subespacio de sí mismo. El con- 


junto {0}, que consiste sólo del vector cero, también es un subespacio de V, llamado sub- 
espacio cero. Para demostrar esto, note simplemente que se satisfacen las dos condicio- 
nes de cerradura del Teorema 6.2: 


Los subespacios {0} y V se llaman subespacios triviales de V. 


0+0=0 y 


c0 =0 para cualquier escalar c 


sl 
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Un examen de la demostración del Teorema 6.2 revela el siguiente hecho útil: 


Si W es un subespacio de un espacio vectorial V, entonces W contiene el vector cero 0 
de V. 


Este hecho es consistente con, y análogo a, el hecho de que las rectas y los planos son 
subespacios de R? si y sólo si contienen al origen. El requisito de que todo subespacio 
debe contener 0 en ocasiones es útil para demostrar que un conjunto no es un subespacio. 


Ejemplo 6.15 


Sea W el conjunto de todas las matrices de 2 X 2 de la forma 
le a+ "| 
0 b 


Solución Cada matriz en W tiene la propiedad de que su entrada (1, 2) es uno más que 
su entrada (1, 1). Dado que la matriz cero 


loa 


no tiene esta propiedad, no está en W. Por tanto, W no es un subespacio de M,,. 


¿W es un subespacio de M,,? 


mki 


> 


Ejemplo 6.16 


Sea W el conjunto de todas las matrices de 2 X 2 con determinante igual a 0. ¿W es un 
subespacio de M,,? (Dado que O = 0, la matriz cero está en W, de modo que el método 
del ejemplo 6.15 no es útil aquí.) 


Ao Y alos 


Entonces det A = det B = 0, de modo que A y B están en W. Pero 


1 0 
a+o=[, 0] 
0 1 


Solución Sea 


de modo que det(A + B) = 1 % 0, y por tanto A + B no está en W. Por tanto, W no es 
cerrado para la suma y en consecuencia no es un subespacio de M),. | 


La noción de conjunto generador de vectores se transporta fácilmente de R” a espacios 
vectoriales en general. 


Definición sis = (v,v,,..., v,) es un conjunto de vectores en un espacio vec- 
torial V, entonces el conjunto de todas las combinaciones lineales de v,, V», . . . , V, Se 
llama el generador de v,, v,, . . . , v, y se denota gen(v,, V» .. . , Vv,) o gen(S). Si V = 
gen(S), entonces S se llama conjunto generador para V y se dice que V es generado 
por S. 


Ejemplo 6.17 
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Demuestre que los polinomios 1, x y x? generan P,. 


Solución Por su definición, un polinomio p(x) = a + bx + cx? es una combinación li- 


neal de 1, x y a”. Por tanto, P, = gen(1, x, x°). 


El ejemplo 6.17 puede generalizarse claramente para demostrar que P, = gen(l, x, 
xl, ...,x”). Sin embargo, ningún conjunto finito de polinomios puede generar P, el es- 
pacio vectorial de todos los polinomios. (Vea el ejercicio 44 de la sección 6.2.) Pero, si se 
permite que un conjunto generador sea infinito, entonces claramente el conjunto de 
todas las potencias no negativas de x lo hará. Esto es, P = gen(l, x, Kyara): 


Ejemplo 6.18 


Demuestre que M,, = gen (E; p E,» E¡3» E,1 E22 E23), donde 
a E 
“loo 21 == [o o 012 Lo 


da A E 
” f1 0o of ?” [o1 o] > [o 


(Esto es, E; es la matriz con un 1 en el renglón 1, columna j y ceros en cualquiera otra 
parte.) 


oo oo 


Solución Sólo es necesario observar que 


le 4 43 


| = ann + apEn + aE + anaE + anEn + aP 
A An z3 


$ 


Al extender este ejemplo, se ve que, en general, M,,,, es generado por las mn matrices 


E;, donde1=1,...,myj=1,...,1. 


ip 


Ejemplo 6.19 


En P, determine si r(x) = 1 — 4x + 6x? está en gen ( p(x), q(x)), donde 
px) =l=a+o y qu =2+x- 3x 


Solución Se buscan escalares c y d tales que cp(x) + dq(x) = r(x). Esto significa que 
dl —x+x%)+4Q+x- 3x) = 1 — 4x + 6x? 
Al reagrupar de acuerdo con las potencias de x, se tiene 
(c + 2d) + (—c + dx + (c — 3d) = 1 — 4x + 67 
Al igualar los coeficientes de potencias iguales de x se obtiene 


c+2d= 1 
=c+ d=-4 
c—3d= 6 
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que se resuelve fácilmente para dar c = 3yd= —1. Por tanto, r(x) = 3p(x) — q(x), de 
> modo que r(x) está en gen(p(x), q(x)). (Compruébelo.) | 
ze 


Ejemplo 6.20 


En F, determine si sen 2x está en gen(sen x, cos x). 


Solución Haga csenx + d cos x = sen 2x y trate de determinar c y d de modo que esta 
ecuación sea verdadera. Puesto que se trata de funciones, la ecuación debe ser verdadera 
para todos los valores de x. Al hacer x = 0, se tiene 


csen0 +dcos0=sen0 o c(0) + d(1) =0 
de donde se ve que d = 0. Al hacer x =7/2, se obtiene 
csen(m/2) + dcos(m/2) = sen(m) o c(1) + d(0) =0 


lo que produce c = 0. Pero esto implica que sen 2x = O(sen x) + O([cos x) = 0 para 
toda x, lo que es absurdo, pues sen 2x no es la función cero. Se concluye que sen 2x no 


está en gen(sen x, cos x). 


Comentario Es verdadero que sen 2x pueda escribirse en términos de sen x y cos x. 
Por ejemplo, se tiene la fórmula de doble ángulo sen 2x = 2 sen xcos x. Sin embargo, ésta 
no es una combinación lineal. 


Ejemplo 6.21 


1 1 1 0 0 1 
En M», describa el generador de A = i | B= | | yo= | |: 


Solución Toda combinación lineal de A, B y C es de la forma 


1 1 1 0 0 1 
cA + dB + eC = d, [+d e | 


0 0 1 1 0 
a dd 
c+e d 


Esta matriz es simétrica, de modo que gen(A, B, C) está contenido dentro del subespacio 
de las matrices simétricas de 2 X 2. De hecho, se tiene una igualdad; esto es toda matriz 


. Aa z x 
simétrica de 2 X 2 está en gen(A, B, C). Para demostrar esto, sea | ” una 
matriz simétrica de 2 X 2. Al hacer yoz 


E j E j +d c+ | 
y z c+e d 
y resolver para c y d, se descubre que c = x — z, d = zy e = —x + y + z. En consecuencia, 


E al, altda i +crtrtal al 


(Compruébelo.) Se concluye que gen(A, B, C) es el subespacio de las matrices simétricas de 


2X2. 
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Como fue el caso en R”, el generador de un conjunto de vectores siempre es un sub- 
espacio del espacio vectorial que los contiene. El siguiente teorema precisa este resultado. 
Generaliza el Teorema 3.19. 


Teorema 6.3 


Sean v}, V» . . . , V, Vectores en un espacio vectorial V. 


, V) es un subespacio de V. 
, Vy) es el subespacio más pequeño de V que contiene a V}, V», ..., Vg. 


a. gen(v;, v,... 
b. geniv Ko 


Demostración (a) La demostración de la propiedad (a) es idéntica a la del Teorema 
3.19, con V en sustitución de R”. 


(b) Para establecer la propiedad (b), es necesario demostrar que cualquier subespacio 
de V que contenga v;, V» . . ., V, también contiene gen(v,, V» . . -, V,). En concordancia, 
sea W un subespacio de V que contiene v}, V}, . . . , Vp Entonces, dado que W es cerrado 
para la suma y la multiplicación por un escalar, contiene a toda combinación lineal c,v, 


+ CV) Er + av de Vi, Vas... 


Ejercicios 6.1 


, V, Por tanto, gen(v,, V» . . -> V,) está contenido en W. 
— 


Y 


En los ejercicios 1-11, determine si el conjunto dado, junto con 
las operaciones especificadas de suma y multiplicación por un 
escalar, es un espacio vectorial. Si no lo es, mencione todos los 
axiomas que no se cumplen. 


l. 


x 
El conjunto de todos los vectores en R? de la forma | | 
x 


con la suma vectorial y la multiplicación por un escalar 
usuales. 


X 
. El conjunto de todos los vectores | | en R? con x = 0, 
y 


y = 0 (es decir el primer cuadrante), con la suma vecto- 
rial y la multiplicación por un escalar usuales. 


Xx 2 
. El conjunto de todos los vectores H en R? con xy = 0 


(esto es la unión del primero y tercer cuadrantes), con la 
suma vectorial y la multiplicación por un escalar usua- 
les. 


X 
. El conjunto de todos los vectores | | en R? conx =y, 
y 


con la suma vectorial y la multiplicación por un escalar 
usuales. 


. R?, con la suma usual pero con la multiplicación por un 


escalar definida por 


6. R?, con la multiplicación por un escalar usual pero con 


suma definida por 


hi 5 Es E la +x + | 
Yi Y Y +y>+l 


7. El conjunto de todos los posibles números reales positi- 


vos, con suma ® definida por x ® y = xy y multipli- 
cación por un escalar O definida por c O x = x“. 


8. El conjunto de todos los números racionales, con la 


suma y multiplicación usuales. 


9. El conjunto de todas las matrices triangulares superiores 


de 2 X 2, con la suma matricial y la multiplicación por 
un escalar usuales. 


10. El conjunto de todas las matrices de 2 X 2 de la forma 


b 
f al , donde ad = 0, con la suma matricial y multi- 
c 


plicación por un escalar usuales. 


11. El conjunto de todas las matrices antisimétricas de 


n X n, con la suma matricial y la multiplicación por 
un escalar usuales (vea la página 168). 


12. Termine de verificar que P, es un espacio vectorial (vea 


el ejemplo 6.3). 


13. Termine de verificar que F es un espacio vectorial (vea 


el ejemplo 6.4). 
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los ejercicios 14-17, determine si el conjunto dado, junto 


un escalar, es un espacio vectorial complejo. Si no lo es, men- 
cione todos los axiomas que no se cumplen. 


14. 


15. 


16. El conjunto C? con la suma usual pero la multiplicación 


17. 


El conjunto de todos los vectores en C? de la forma 


Z : ME ERT 
H , con la suma vectorial y la multiplicación por un 
z 


escalar usuales. 


El conjunto M,,, (C) de todas las matrices complejas de 
m X n, con la suma matricial y la multiplicación por un 
escalar usuales. 


a] 

cz] 

R”, con la suma vectorial y multiplicación por un esca- 
lar usuales. 


por un escalar definida por d a| = 
22 


En los ejercicios 18-21, determine si el conjunto dado, junto 


con las operaciones especificadas de suma y multiplicación por 


un escalar, es un espacio vectorial sobre el Z, indicado. Si no 
lo es, mencione todos los axiomas que no se sostienen. 


18. 


19. 


20. 


21: 


22. 
23. 


El conjunto de todos los vectores en Z} con un número 
par de números 1 sobre Z, con la suma vectorial y la 
multiplicación por un escalar usuales. 


n 


El conjunto de todos los vectores en Z} con número 
impar de números 1 sobre Z, con la suma vectorial y la 
multiplicación por un escalar usuales. 

El conjunto Mia Es) de todas las matrices de m X n 
con entradas de Z,, sobre Z, con la suma matricial y la 
multiplicación por un escalar usuales. 

Zo sobre Z, con la suma y la multiplicación usuales. 
(¡Piense esto cuidadosamente!) 

Demuestre el Teorema 6.1(a). 


Demuestre el Teorema 6.1(c). 


En los ejercicios 24-45, use el Teorema 6.2 para determinar si 
W es un subespacio de V. 


24. 


25. 


26. 


a 
V= Ri, Ww = 0 
a 
a 
V = RW = —a 
2a 
a 
V= R, W = b 
a+b+1 


2. 


a 
.V= R,W = b 
a 


v=maw= {i E} 


.V= Mp W= i 0 2ad = 00) 
c d 


. V= Mw W = {A en M,, : det A = 1} 

. V = Mi,» W es el conjunto de matrices diagonales de 
nxn 

. V = Ms,» W es el conjunto de matrices idempotentes de 
nXn 


.V=M, W= {A en M, : AB = BA}, donde B es una 


nn? nn 


matriz dada (fija) 


. V = Pp, W = {bx + cx*% 
.V= P, W= {a + bx+cx?:a+b+c= 0} 
.V=P, W = {a + bx + cx?: abc = 0} 


. V = P, W es el conjunto de todos los polinomios de 
grado 3 
V=F,W= {fen F:f(=x) =/(4)) 
V=F,W= {f en F:f(=x) = -f(x)} 
V=*W=(fen*:f(0) = 1) 
V=*W=¿fen*:f(0)=0) 
V = F, W es el conjunto de todas las funciones inte- 


grables 
V= 9, W = {f en D:f'(x) = 0 para toda x} 


[43 
pz 44. 


V = F, W = €0, el conjunto de todas las funciones 
con segundas derivadas continuas 


47. 


48. 


245. V = F, W= {f en F : lím f(x) = 00) 
46. 


Sea V un espacio vectorial con subespacios U y W. 
Pruebe que U N W es un subespacio de V. 

Sea V un espacio vectorial con subespacios U y W. 
Ofrezca un ejemplo con V = R? para demostrar que 
U U W no necesita ser un subespacio de V. 

Sea V un espacio vectorial con subespacios U y W. De- 
fina la suma de U y W como 


U+ W= {u + w: u está en U, w está en W} 


(a) Si V = R?, U es el eje x, y W es el eje y, ¿qué es U + 
W? 

(b) Si U y W son subespacios de un espacio vectorial V, 
pruebe que U + W es un subespacio de V. 


. Si U y V son espacios vectoriales, defina el producto car- 


tesiano de U y V como 
U X V = [(u, v) : u está en U y v está en V} 


Demuestre que U X V es un espacio vectorial. 


50. Sea W un subespacio de un espacio vectorial V. Pruebe 
que A = [(w, w) : w está en W} es un subespacio de 


VXV. 
1 1 
y 


En los ejercicios 51 y 52, sean A = | i 


I *=1 

B= $ 2] Determine si C está en gen(A, B). 

1 2 3 =5 
sf sla 

3 4 5 =f 
En los ejercicios 53 y 54, sean p(x) = 1 — 2x, q(x) = x — x? y 
r(x) = —2 + 3x + x’. Determine si s(x) está en gen(p(x), 
q(x), r(x)). 


53. s(x) = 3 — 5x- x?  54.s(x)=1+x+x 


En los ejercicios 55-58, sean f(x) = sen?x y g(x) = cos”x. De- 
termine si h(x) está en gen( f(x), g(x)). 
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55. h(x) = 1 56. h(x) = cos 2x 
57. h(x) = sen 2x 58. h(x) = sen x 


59. 


60. 


6l. 
62. 


63. 


64. 


1 1 0 1 1 0 
¿ Ma: es generado por ; y ; 


0 1 1 0 1 1 
$ “l 
1 0 
1 
¿ Mn: es generado por i 


1 0 
¿ P, es generado por 1 + x, x + x°, 1 + x°? 
¿P, es generado por 1 + x + 2x°, 2 + x + 2x°, 
=1 +x + 2x°? 
Demuestre que todo espacio vectorial tiene un vector 
cero único. 


Demuestre que para todo vector v en un espacio vecto- 
rial V, existe un v' único en V tal quev + v' = 0. 


independencia lineal, bases y dimensión 


En esta sección se amplían las nociones de independencia lineal, base y dimensión a es- 
pacios vectoriales en general, lo que generaliza los resultados de las secciones 2.3 y 3.5. 
En la mayoría de los casos se realizan las demostraciones de los teoremas; simplemente 
se sustituye R” por el espacio vectorial V. 


Definición Un conjunto de vectores (v,, v,, ..., v,) en un espacio vectorial V es 


linealmente dependiente si existen escalares C,, C,,... 


es cero, tales que 


, Cp al menos uno de los cuales no 


CV, T OV + c+ er =0 


Un conjunto de vectores que no es linealmente dependiente se dice que es lineal- 


mente independiente. 


Como en R”, {v}, V»... 


si y sólo si 


CV E OV, +: + ew = 0 implica c 


, Va} es linealmente independiente en un espacio vectorial V 


=0,0,=0,...,,=0 


También se tiene la siguiente formulación alternativa de dependencia lineal que es muy 


útil. 
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Teorema 6.4 


Un conjunto de vectores {V}, V» ...., V,) en un espacio vectorial V es linealmente de- 
E k 

pendiente si y sólo si al menos uno de los vectores puede expresarse como una com- 

binación lineal de los otros. 


Pe 5% SA 2.5. 
Demostración La demostración es idéntica a la del Teorema 


Como caso especial del Teorema 6.4, note que un conjunto de dos vectores es lineal- 
mente dependiente si y sólo si uno es un múltiplo escalar del otro. 


omni a 


> 
En P,, el conjunto {1 + x + x°, 1 — x + 3x7, 1 + 3x — x°} es linealmente depen- 


diente, pues 


Meer (=x =1 4 =x 


Ejemplo 6.23 


En M,» sea 


Entonces A + B = C, de modo que el conjunto (A, B, C} es linealmente dependiente. 


mE 


Ejemplo 6.24 


> 
En F, el conjunto (sen”x, cos”x, cos 2x} es linealmente dependiente, pues 


cos 2x = cos?x — sen?x | 


Ejemplo 6.25 


> 
Demuestre que el conjunto (1, x, x, ...., x”) es linealmente independiente en P,.. 


Solución 1 Suponga que cy C;, ... ., €, Son escalares tales que 
a'l + ax + ox? + +o?=0 


Entonces el polinomio p(x) = c, + c,x + cx +++- + c,x” es cero para todos los valores 
de x. Pero un polinomio de grado n como máximo no puede tener más de n ceros (vea 
el Apéndice D). De modo que p(x) debe ser el polinomio cero, lo que significa que c, = 
& = 0, =t = c, = 0. Por tanto, (1, x, xX, ..., X”} es linealmente independiente. 


A Solución 2 Comience, como en la primera solución, por suponer que 


x) =Q tarto oa" = 
P 0 1 2 n 


Dado que esto es verdadero para toda x, puede sustituir x = 0 para obtener c, = 0. Esto 
deja 


ax + ox? +++ ex = 0 
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Al sacar derivadas se obtiene 
Cc + 2eox + 302 + + ncax!=0 


y al hacer x = 0, se ve que c, = 0. Al derivar 2c,x + 3c,x? +-+ + nc,x""? = 0 y hacer 
x= 0, se encuentra que 2c, = 0, de modo que c, = 0. Al continuar de esta forma, se en- 
cuentra que k!c, = 0 para k =0,..., n. En consecuencia, & ==, ="""=cCc,=0y 


n 
[LL x,x0,...,x”) es linealmente independiente. 


> 
Ejemplo 6.26 En P,, determine si el conjunto {1 + x, x + x°, 1 + x?) es linealmente independiente. 


Solución Sean c,, c, y c} escalares tales que 

all +x) art Falsa =0 
Entonces 

latat (atot (6 +0) =0 


Esto implica que 


Cc) +c=0 


cuya solución es c, = c, = c, = 0. Se tiene que {1 + x, x + x?, 1 + x°} es linealmente in- 


dependiente. 


Comentario Compare el ejemplo 6.26 con el ejemplo 2.23(b). El sistema de ecua- 
ciones que surge es exactamente el mismo. Esto se debe a la correspondencia entre P, y 
R°? que relaciona 


1 0 1 
l+xo|1| x+x2ol1l 1+x201/0 
0 1 1 


y produce las columnas de la matriz de coeficientes del sistema lineal que debe resol- 
verse. Por tanto, demostrar que [1 + x, x + x’, 1 + x?) es linealmente independiente 
equivale a demostrar que 


1 0 
1||1]/0 
0 1 1 


es linealmente independiente. Esto puede hacerse al simplemente establecer que la ma- 
triz 


1.0 1 
1 1 0 
0 1 1 


tiene rank 3, por el teorema fundamental de las matrices invertibles. 
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Ejemplo 6.27 


Ejemplo 6.28 


En F determine si el conjunto [sen x, cos x} es linealmente independiente. 


Solución Las funciones f(x) = sen x y g(x) = cos x son linealmente dependientes si y 
sólo si una de ellas es un múltiplo escalar de la otra. Pero es claro a partir de sus gráficas 
que este no es el caso, pues, por ejemplo, cualquier múltiplo distinto de cero de f(x) = 
sen x tiene los mismos ceros, ninguno de los cuales es cero de g(x) = cos x. 

Es posible que el uso de este planteamiento no siempre sea adecuado, de modo que 
se ofrece el siguiente método directo más computacional. Suponga que c y d son escala- 
res tales que 


csenx+dcosx=0 


Al hacer x = 0, se obtiene d = 0, y al hacer x = 7/2, se obtiene c = 0. En consecuen- 
cia, el conjunto {sen x, cos x} es linealmente independiente. 


Aunque las definiciones de dependencia e independencia lineal se enuncian en tér- 
minos de conjuntos de vectores finitos, puede extender los conceptos a conjuntos infini- 
tos del modo siguiente: 


Un conjunto S de vectores en un espacio vectorial V es linealmente dependiente si 
contiene infinitos vectores linealmente dependientes. Un conjunto de vectores que no 
es linealmente dependiente se dice que es linealmente independiente. 


Note que para conjuntos finitos de vectores, esto es justo la definición original. El si- 
guiente es un ejemplo de un conjunto infinito de vectores linealmente independientes. 


En P, demuestre que S = {1, x, x?, . . .} es linealmente independiente. 


Solución Suponga que existe un subconjunto finito T de S que es linealmente depen- 
diente. Sea x” la potencia más alta de x en T y sea x” la potencia más baja de x en T. En- 
tonces existen escalares c,,, € , €, NO todos cero, tales que 


wen... 
n n+1 m — 
EX Fia ee +eax"=0 
Pero, por un argumento similar al que se usó en el ejemplo 6.25, esto implica que c, = 


Cay =***= Cp = 0, lo que es una contradicción. Por tanto, $ no puede contener finitos 
vectores linealmente dependientes, de modo que es linealmente independiente. 


El importante concepto de base ahora se extiende con facilidad a espacios vectoriales ar- 
bitrarios. 


Definición Un subconjunto B de un espacio vectorial V es una base para V si 


1. B generaa Vy 
2. Bes linealmente independiente. 
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> 


Ejemplo 6.29 Si e, es la ¡-ésima columna de la matriz identidad de n X n, entonces {e}, e,,..., e, ) es una 
base para R”, llamada base estándar para R". 


<+ 


Ejemplo 6.30 [Lx,x2...,x”) es una base para P „llamada base estándar para P „ 


y -+ 


> 
Ejemplo 6.31 El conjunto € = (Ej; ... > Eim Ezy + + + > Esp Emn > + > Em) es una base para Mp donde 


mn? 


las matrices E; se definen como en el ejemplo 6.18. € se llama base estándar para Mn. 


Ya se vio que € genera a M,,,,. Es fácil demostrar que € es linealmente independiente. 
»— Y (¡Verifique esto!) Por tanto, € es una base para M, 


mn* | 


Ejemplo 6.32 Demuestre que B = {1 + x x + x’, 1 + x?) es una base para P,. 


Y — solución Ya se demostró en el ejemplo 6.26 que B es linealmente independiente. Para 
Jemp q P 
demostrar que B genera a P,, sea a + bx + cx” un polinomio arbitrario en P,. Debe de- 
mostrar que existen escalares c}, c, y c, tales que 


all +x) + olx + x’) + a(l +x) =a + bx + cx? 
o, de manera equivalente, 
(ata) + (a, + o)x + (o + g)? = a + bx + cx? 


Al igualar coeficientes de potencias iguales de x, se obtiene el sistema lineal 


& t G=a 
GFG =b 
0) +06=C 


1.001 
que tiene una solución, pues la matriz de coeficientes | 1 1 0 | tiene rank 3 y, por 
0 1 1 


tanto, es invertible. (No es necesario saber cuál es la solución; sólo es necesario saber que 
existe.) En consecuencia, B es una base para P,. 
1 


0 1 
Comentario Observe que la matriz | 1 1 0 | esla clave del ejemplo 6.32. Inmediata- 
0 1 1 


mente se le puede obtener al usar la correspondencia entre P, y R°, como se indicó en el 
Comentario que siguió al ejemplo 6.26. 
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Demuestre que B = [1,x,x?,...) es una base para P. 


Solución En el ejemplo 6.28 se vio que B es linealmente independiente. También ge- 
nera a P, pues claramente todo polinomio es una combinación lineal de (un número fi- 
nito) de potencias de x. 


E 


Ejemplo 6.34 


a 


Encuentre bases para los tres espacios vectoriales del ejemplo 6.13: 


(b) W, = {a + bx — bx? + ax) (c) W; = TE al 


b a 


Solución Una vez más se trabajarán los tres ejemplos lado por lado para destacar las si- 
militudes entre ellos. En un sentido estricto, se trata del mismo ejemplo, pero no será 
sino hasta la sección 6.5 cuando esta idea se precise a la perfección. 


(a) Dado que 


a 1 0 
b 0 1 
=a +b 
=b 0 =] 
a 1 0 


se tiene W, = gen(u, v), donde 


1 

0 l 1 
u E 
0 
1 


Dado que {u, v} es sin duda lineal- 
mente independiente, también es una 
base para W}. 


(b) Dado que 


a + bx — bx? + ax? 
= a(l + x’) + b(x — x’) 


se tiene W, = gen (u(x), v(x)), 
donde 


u(x) = 1 +x’ 


v(x) =x — x? 


< 


Dado que fu(x), v(x)) sin du- 
da es linealmente independiente, tam- 
bién es una base para W}. 


(c) Dado que 


alo deL o 


Dado que {U, V} sin duda es lineal- 
mente independiente, también es una 


base para W3. 


La sección 3.5 introdujo la idea de las coordenadas de un vector con respecto a una base 
para subespacios de R”. Ahora se extiende este concepto a espacios vectoriales arbitra- 


rios. 


Teorema 6.5 


Sea V un espacio vectorial y sea B una base para V. Para todo vector v en V, existe 


exactamente una forma de escribir v como una combinación lineal de los vectores 
base en B. 


Demostración La demostración es igual que la del Teorema 3.29. Funciona incluso si la 
base B es infinita, pues las combinaciones lineales son, por definición, finitas. 


— 
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El inverso del Teorema 6.5 también es verdadero. Esto es, si B es un conjunto de vec- 
tores en un espacio vectorial V con la propiedad de que todo vector en V se puede escri- 
bir de manera única como una combinación lineal de los vectores en B, entonces B es 
una base para V (vea el ejercicio 30). En este sentido, la propiedad de representación única 
caracteriza a una base. 

Dado que la representación de un vector con respecto a una base es única, la si- 
guiente definición tiene sentido. 


Definición Sea 8 = {v,, v,,..., v,) una base para un espacio vectorial V. Sea v 
un vector en V y escriba v = c,v, + eVa +-*** + c,v,. Entonces C,, C,, . . ., €, se llaman 
las coordenadas de v con respecto a B y el vector columna 


C1 


se llama vector coordenado de v con respecto a B. 


Observe que si la base B de V tiene n vectores, entonces [y ]g es un vector (columna) 
en R”. 


> 


Encuentre el vector coordenado [p(x) ]z de p(x) = 2 — 3x + 5x? con respecto a la base 
estándar B = (1, x, x°} de P. 


Solución Fl polinomio p(x) ya es una combinación lineal de 1, x y x?, de modo que 


2 
[p(x)]g = | =3 


-4 


La anterior es la correspondencia entre P, y R? que se destacó en un comentario des- 
pués del ejemplo 6.26, y se puede generalizar fácilmente para demostrar que el vector co- 
ordenado de un polinomio 


p(x) = a + ax + ax? ++ a,x” en P, 
con respecto a la base estándar B = {1, x, x’, . . . , x"} es justo el vector 


do 


[p() Js =| a, | en RS 


a 


n. 


Comentario El orden en el que los vectores base aparecen en B afecta el orden de las en- 
tradas o elementos en un vector coordenado. Por ejemplo, en el ejemplo 6.35, suponga 
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que los vectores base estándar están ordenados como B' = [x?, x, 1}. Entonces el vector 
coordenado de p(x) = 2 — 3x + 5x? con respecto a B' es 


| > 


2 1 
Encuentre el vector coordenado [A]; de A = | a a] con respecto a la base estándar 
B = {E Ej» Esy Ez) de M)>. 
Solución Dado que 
b 3] F o ha a E e E o 
A= =2 - +4 +3 
4 3 0 0 0 0 1 0 o 1 


= 2E,, — Ej, + 4E,, + 3E,, 
se tiene [4]g = 


La anterior es la correspondencia entre M,, y [R* que se observó antes de la intro- 
ducción al ejemplo 6.13. También se puede generalizar con facilidad para dar una 


correspondencia entre M,,,, y R”. 


| he 


Ejemplo 6.37 


Encuentre el vector coordenado [p(x)]y de p(x) = 1 + 2x — x? con respecto a la base 
Claridad. 


Solución Necesita encontrar c,, c, y c, tales que 

allta tarta) tal+x)=el+ih=x 
o, de manera equivalente, 

lai ta) + [c, + cx + (0, + c3)Jx?= 1 +2x = x? 


Como en el ejemplo 6.32, esto significa que es necesario resolver el sistema 


Cc; + & = 1 
ĉi + C, = 
c+c=-l 
cuya solución se encontró era c 2 0,c 1. Por tanto, 
I 2 3 
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M=> [Dado que este resultado dice que p(x) = 2(1 + x) — (1 + x°), es fácil comprobar que 


esto es correcto. ] 


El siguiente teorema muestra que el proceso de formar vectores coordenados es 
compatible con las operaciones de espacio vectorial de suma y multiplicación por un 
escalar. 


Teorema 6.6 Sea B = (v, v,,..., v,} una base para un espacio vectorial V. Sean u y v vectores en V 


y sea c un escalar. Entonces 


a. [u +], = [u]g + [v]g 
b. [cu]s = c[u]g 


Demostración Comience por escribir u y v en términos de vectores base, por decir, 
como 


u = GV + ew Hee ECN y v= dw + dav, +: + dN, 
Entonces, al usar las propiedades de espacio vectorial, se tiene 
u +v = (c +div + (c, + d,)v, ++ +(c, + d,)v,, 
y cu = (cc,)v, + (cc,)v, +++ + (cc,)v,, 


de modo que 


Cc, + d, c dı 
[utv PTA] A | = fuls + [vls 
ETA a d, 
CC; či 
y [cu]s = | % | =c 2? | = quis 
EC, i 


n BE | 


Un sencillo corolario al Teorema 6.6 afirma que los vectores coordenados preservan 
las combinaciones lineales: 


[au +++ (u4)]a = alu]s +++ alu]g (1) 


En el ejercicio 31 se le pide probar este corolario. 

El aspecto más útil de los vectores coordenados es que permiten transferir informa- 
ción desde un espacio vectorial general a R”, donde tiene a su disposición las herra- 
mientas de los capítulos 1 a 3. En las secciones 6.3 y 6.6 se explorarán con más detalle 
estas ideas. Por el momento, se tiene el siguiente teorema útil. 
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Teorema 6.7 


Teorema 6.8 


Sea B = {v}, V»... V„} una base para un espacio vectorial V y sean uj, ..., U% 
vectores en V. Entonces {u}, . . . , u,) es linealmente independiente en V si y sólo si 
[[u, ]z» . - -> [uz]g} es linealmente independiente en R”. 


Demostración Suponga que {u}, .. . , u} es linealmente independiente en V y sea 
afw]s + + cuz ]s = 0 
en R”. Pero entonces se tiene 
[cu +: + cu], =0 
al usar la ecuación (1), de modo que las coordenadas del vector cju, +++: + cu, con res- 
pecto a B son todas cero. Esto es, 
CU, +++ + cu, = Ov, + 0v, ++: + 0v, =0 
La independencia lineal de {u}, . . . , u,} ahora fuerza que c, = c, =***= c = 0, de modo 


que ([u; )z, .. ., Luz ]s) es linealmente independiente. 
La implicación inversa, que usa ideas similares, se deja como ejercicio 32. 


Observe que, en el caso especial donde u; = v, se tiene 


y= py +: Lev +. +0-vY, 


de modo que [v;]y = e; y [[v,];...>[v,]s) = {€p ..., e, ) es la base estándar en R”. 


Dimensión 
La definición de dimensión es la misma para un espacio vectorial que para un subespa- 
cio de R”: el número de vectores en una base para el espacio. Dado que un espacio vec- 
torial puede tener más de una base, es necesario demostrar que esta definición tiene sen- 
tido; es decir: es necesario establecer que diferentes bases para el mismo espacio vectorial 
contienen el mismo número de vectores. 

La parte (a) del siguiente teorema generaliza el Teorema 2.8. 


Sea B = [v,, V» . . . , v,) una base para un espacio vectorial V. 


a. Cualquier conjunto con más de n vectores en V debe ser linealmente dependiente. 
b. Cualquier conjunto con menos de n vectores en V no puede generar a V. 


Demostración (a) Sea fu,...,u,) un conjunto de vectores en V, con m > n. Entonces 
[[u,)z ... > [u,]g) es un conjunto con más de n vectores en R” y, por tanto, es lineal- 
mente dependiente, por el Teorema 2.8. Esto significa que también (u,,...,u,,) es li- 


nealmente dependiente, por el Teorema 6.7. 

(b) Sea [u,,..., u,) un conjunto de vectores en V, con m < n. Entonces S = 
[lu] y - - ..[u,,] ¿) es un conjunto con menos de n vectores en R”. Ahora, gen(u,..., 
u,,) = V si y sólo si gen(S) = R” (vea el ejercicio 33). Pero gen(S) es justo el espacio 


columna de la matriz de n X m 
A = [[w]s +: [u,]s) 


de modo que dim(gen(S)) = dim(col(4)) = m < n. Por tanto, S no puede generar a R”, 
así que (u,,...,Uu,,) no genera a V. _ A 


Ahora se amplía el Teorema 3.23. 
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Teorema 6.9 


El teorema de la base 


Si un espacio vectorial V tiene una base con n vectores, entonces toda base para V 
tiene exactamente n vectores. 


La demostración del Teorema 3.23 también funciona aquí, virtualmente palabra por 
palabra. Sin embargo, es más fácil usar el Teorema 6.8. 


Demostración Sea 5 una base para V con n vectores y sea BB” otra base para V con m 
vectores. Por el Teorema 6.8, m <= n; de otro modo, $” sería linealmente dependiente. 
Ahora use el Teorema 6.8 con los roles de B y B' intercambiados. Dado que B' es una 
base de V con m vectores, el Teorema 6.8 implica que cualquier conjunto con más de m 
vectores en V es linealmente dependiente. Por tanto, n < m, pues B es una base y, por 
tanto, es linealmente independiente. 
Dado que n S m y m <= n se debe tener n = m, como se requiere. —— A 


Ahora la siguiente definición tiene sentido, pues el número de vectores en una base 
(finita) no depende de la elección de base. 


Definición Un espacio vectorial V se llama de dimensión finita si tiene una base 
que consiste de un número finito de vectores. La dimensión de V, denotada mediante 
dim V, es el número de vectores en una base para V. La dimensión del espacio vecto- 
rial cero {0} se define como cero. Un espacio vectorial que no tiene base finita se llama 
de dimensión infinita. 


> 
Dado que la base estándar para R” tiene n vectores, dim R” = n. En el caso de R’, un 
subespacio unidimensional es justo el generador de un solo vector distinto de cero y 
por tanto es una recta que pasa por el origen. Un subespacio bidimensional es gene- 
rado por su base de dos vectores linealmente independientes (es decir, no paralelos) y 
por tanto es un plano que pasa por el origen. Cualesquiera tres vectores linealmente 
independientes deben generar R?, por el teorema fundamental. Los subespacios de R? 
ahora están completamente clasificados de acuerdo con la dimensión, como se mues- 
tra en la tabla 6.1. 


Tabla 6.1 
dim V vV 


3 R? 
Plano que pasa por el origen 
Recta que pasa por el origen 


{0} ! 


O =. N 


> 
La base estándar para Y, contiene n + 1 vectores (vea el ejemplo 6.30), de modo que 


dim, =n+1. 
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Ejemplo 6.40 


> 
La base estándar para M,,, contiene mn vectores (vea el ejemplo 6.31), de modo que 


dim M,,, = mn. 


Ejemplo 6.41 


> 
Tanto P como Y son de dimensión infinita, pues cada uno de ellos contiene el conjunto 
infinito linealmente independiente (1, x, x°, . . .} (vea el ejercicio 44). 


Ejemplo 6.42 


> 
Encuentre la dimensión del espacio vectorial W de matrices simétricas de 2 X 2 (vea el 


ejemplo 6.10). 


Solución Una matriz simétrica de 2 X 2 es de la forma 


lodo oleo odo 1) 


de modo que W es generado por el conjunto 


E JEE 


Si S es linealmente independiente, entonces será una base para W. Al hacer 


do ola ol do =o o 
alo a) 


de donde se tiene inmediatamente que a = b = c = 0. En consecuencia, S es linealmente 
independiente y, por tanto, es una base para W. Se concluye que dim W = 3. 


La dimensión de un espacio vectorial es su “número mágico”. Conocer la dimensión 
de un espacio vectorial V brinda mucha información acerca de V y puede simplificar 
enormemente el trabajo necesario en ciertos tipos de cálculos, como ilustran los si- 
guientes teoremas y ejemplos. 


se obtiene 


Teorema 6.10 


Sea V un espacio vectorial con dim V = n. Entonces: 


a Cualquier conjunto linealmente independiente en V contiene cuando mucho n 
vectores. 

b. Cualquier conjunto generador para V contiene al menos n vectores. 

c. Cualquier conjunto linealmente independiente de exactamente n vectores en V es 
una base para V. 

d. Cualquier conjunto generador para V que consiste de exactamente n vectores es 
una base para V. 

e. Cualquier conjunto linealmente independiente en V se puede extender a una base 
para V. 

f. Cualquier conjunto generador para V puede reducirse a una base para V. 
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Demostración Las demostraciones de las propiedades (a) y (b) se deducen de los incisos 
(a) y (b) del Teorema 6.8, respectivamente. 


(c) Sea S un conjunto linealmente independiente de exactamente n vectores en V. Si S no 
genera a V, entonces existe algún vector v en V que no es una combinación lineal de los 
vectores en S. Al insertar v en S se produce un conjunto S' con n + 1 vectores que todavía 
es linealmente independiente (vea el ejercicio 54). Pero esto es imposible, por el Teorema 
6.8(a). Se concluye que S debe a generar V y por tanto es una base para V. 


(d) Sea S un conjunto generador para V que consiste de exactamente n vectores. Si S es 
linealmente dependiente, entonces algún vector v en S es una combinación lineal de los 
otros. Al quitar v el conjunto S’ queda con n — 1 vectores que todavía generan V (vea el 
ejercicio 55). Pero esto es imposible, por el Teorema 6.8(b). Se concluye que S debe ser li- 
nealmente independiente y por tanto es una base para V. 


(e) Sea S un conjunto linealmente independiente de vectores en V. Si S genera V, es una 
base para V y por tanto consiste de exactamente n vectores, por el teorema de la base. Si 
S no genera a V, entonces, como en la demostración de la propiedad (c), existe algún vec- 
tor v en V que no es una combinación lineal de los vectores en S. Al insertar ven S se pro- 
duce un conjunto S” que todavía es linealmente independiente. Si S' todavía no genera a 
V, puede repetir el proceso y expandirlo a un conjunto linealmente independiente más 
grande. Con el tiempo, este proceso debe detenerse, pues ningún conjunto linealmente 
independiente en V puede contener más de n vectores, por el Teorema 6.8(a). Cuando el 
proceso se detiene, se tiene un conjunto linealmente independiente S* que contiene a S 
y también genera a V. Por tanto, S* es una base para V que se extiende a S. 


(f) En el ejercicio 56 se le pide probar esta propiedad. _— 
El Teorema 6.10 debe verse, en parte, como un dispositivo para ahorrar trabajo. En 
muchas instancias puede reducir dramáticamente la cantidad de trabajo necesaria para 


comprobar que un conjunto de vectores es linealmente independiente, un conjunto ge- 
nerador o una base. 


Ejemplo 6.43 


En cada caso, determine si S es una base para V. 


(a) V=P, S={1 +x,2 — x +x’, 3x — 2x? —1 + 3x + x?) 


MR A) 


(c) V=P, S=41+xx+a?,1+xu) 


Solución (a) Dado que dim(%P,) = 3 y S contiene cuatro vectores, S es linealmente de- 
pendiente, por el Teorema 6.10(a). En consecuencia, S no es una base para P,. 


(b) Dado que dim(M,,) = 4 y S contiene tres vectores, S no puede generar M,,, por el 
Teorema 6.10(b). Por tanto, S no es una base para M,,. 


(c) Dado que dim(P,) = 3 y S contiene tres vectores, S será una base para P, si es li- 
nealmente independiente o si genera a P,, por el Teorema 6.10(c) o (d). Es más fácil de- 
mostrar que S es linealmente independiente; esto se hizo en el ejemplo 6.26. Por tanto, S 
es una base para P,. (Este es el mismo problema del ejemplo 6.32, ¡pero vea cuánto más 
sencillo se vuelve al usar el Teorema 6.10!) - 


> 


Ejemplo 6.44 


y — 


Extienda (1 + x, 1 — x} a una base para P.. 


Solución Note primero que {1 + x, 1 — x} es linealmente independiente. (¿Por qué?) 
Dado que dim (P,) = 3, es necesario un tercer vector, uno que no sea linealmente de- 
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pendiente de los dos primeros. Podría proceder como en la demostración del Teorema 
6.10(e) para encontrar tal vector usando ensayo y error. Sin embargo, es más fácil en la 
práctica proceder en forma diferente. 

El conjunto dado de vectores se amplía al agregar toda la base estándar para P,. Esto 
produce 


S={1+x,1- x Las] 


Ahora S es linealmente dependiente, por el Teorema 6.10(a), de modo que es necesario 
eliminar algunos vectores; en este caso, dos. ¿Cuáles? Use el Teorema 6.10(f) y comience 
con el primer vector que se agregó, 1. Dado que 1 =3(1 + x) + 3(1 — x), el conjunto 
{1 + x,1— x, 1) es linealmente dependiente, de modo que se elimina 1. De igual manera, 
x =3(1 + x) — 3(1 — x), de modo que {1 + x, 1 — x, x} también es linealmente depen- 
diente. Finalmente, compruebe que [1 + x, 1 — x, x?) es linealmente independiente. 
»—> (¿Puede ver una forma rápida para decir esto?) En consecuencia, {1 + x, 1 — x, x?) es 


una base para P, que extiende (1 + x, 1 — x}. 


En el ejemplo 6.42, el espacio vectorial W de matrices simétricas de 2 X 2 es un subes- 
pacio del espacio vectorial M,, de todas las matrices de 2 X 2. Como se demostró, 
W = 3 < 4 = dim M, Éste es un ejemplo de un resultado general, como muestra el teo- 
rema final de esta sección. 


Teorema 6.11 sea wun subespacio de un espacio vectorial de dimensión finita V. Entonces: 


a. W es de dimensión finita y dim W < dim V. 
b. dim W = dim V si y sólo si W = V. 


Demostración (a) Sea dim V = n. Si W = {0}, entonces dim(W) = 0 < n = dim V. Si 
W es distinta de cero, entonces cualquier base B para V (que contiene n vectores) cierta- 
mente genera a W, pues W está contenido en V. Pero B puede reducirse a una base BB” 
para W (que contiene cuando mucho n vectores), por el Teorema 6.10(£). Por tanto, W 
es de dimensión finita y dim(W) < n = dim V. 

(b) Si W = V, entonces ciertamente dim W = dim V. Por otra parte, si dim W = 
dim V = n, entonces cualquier base B para W consiste de exactamente n vectores. Pero 
entonces estos son n vectores linealmente independientes en V y, en consecuencia, una 


base para V, por el Teorema 6.10(c). Por tanto, V = gen(B) = W. _3 

Ejercicios 6.2 N 
En los ejercicios 1-4, pruebe los conjuntos de matrices para in- 1 —ılļ f1 1 1 1| [|-1 1 
dependencia lineal en M, Para las que sean linealmente de- bi Pi -1Pl=1 iP) i i 


pendientes, exprese una de las matrices como una combina- 


ción lineal de las otras. OES . ; . 
En los ejercicios 5-9, pruebe los conjuntos de polinomios para 


1. l 1 A b =i | : | a a ) independencia lineal. Para los que sean linealmente depen- 
LO —=1j L1 0113 2 dientes, exprese uno de los polinomios como una combinación 
(| 2 i E >] b 1 lineal de los otros. 
2. > > 
[=3 2 3 1 3 7 5d% 1 +x)en 9, 
a (e '| [3 a | 0 a Me I} 6. {1 +x 1- x1 +x+x}enP, 
“lla 2Pl1 1Pl-3 1P[|-1 7 7. {x, 2x — x°, 3x + 2x°} en P, 


8. {2x, 1 — x°, x? — x°, 1 — 2x + x°} en P, 
9il a O A 


En los ejercicios 10-14, pruebe los conjuntos de funciones para 
independencia lineal en F. Para las que son linealmente de- 
pendientes, exprese una de las funciones como una combina- 
ción lineal de las otras. 


10. {1, sen x, cos x} 11. (1, sen?x, cos”x) 
12. [e”,e *) 13. (1, In(Qx), In(x?)) 
14. (sen x, sen 2x, sen 3x} 

[2 15. Si fy g están en G0, el espacio vectorial de todas las fun- 
ciones con derivadas continuas, entonces el determi- 
nante 

g(x) 

g'(x) 

se llama wronskiano de fy g [en honor del matemático 

polaco-francés Jósef Maria Hoëné-Wronski (1776- 

1853), quien trabajó en la teoría de determinantes y la 

filosofía de las matemáticas]. Demuestre que f y g son 

linealmente independientes si su wronskiano no es 
idénticamente cero (esto es, si existe alguna x tal que 


va- 


W(x) + 0). 
216. En general, el wronskiano de f;, ...,f,en 671 es el 
determinante 
Íi(x) HA e f) 
ma- PO AA o Ro 


FEDE A Fea) 
y fp- - -> fa son linealmente independientes, siempre que 


W(x) no sea idénticamente cero. Repita los ejercicios 10- 
14 usando la prueba del wronskiano. 


17. Sea {u, v, w} un conjunto de vectores linealmente inde- 

pendientes en un espacio vectorial V. 

(a) ¿(u + v, v + w, u + w} es linealmente indepen- 
diente? Demuestre que lo es u ofrezca un contra- 
ejemplo para demostrar que no lo es. 

(b) ¿lu — v, v — w, u — w} es linealmente indepen- 
diente? Demuestre que lo es u ofrezca un contra- 
ejemplo para demostrar que no lo es. 


En los ejercicios 18-25, determine si el conjunto B es una base 
para el espacio vectorial V. 


08 do ibli abli a) 
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20. 


21. 


22. 
23. 
24. 
25. 


26. 


27. 


28. 


29. 


30. 


31. 


32. 


33. 


V= M» 

e= {lo ipli abl- ahlo ~il 
o ipli opl- ılo 1 

V= M,» 

e-d ibi abl- iHa abb 2) 
2 11 2P l-3 1ıp{l3 1ıpl3 2 

V=P,B=4(x1-x1>+x+ ax? 

V=9,B={1- x1- xx- x} 

V = P, B = {2 + 3x — 2,1 + 2x + 2x°} 

V= P, B = {1,2 — x, 3 — x’, x + 2x°} 


I 2 
Encuentre el vector coordenado de A = E a con 


respecto a la base B = [E;», Eip E22 E21} de Maz. 


1 2 
Encuentre el vector coordenado de A = o 2 con res- 


1 0| |1 1/1 1/1 1 
1 = 
pecto a la base B ¿lo dl Pl eh iI} 
de M,,. 


Encuentre el vector coordenado de p(x) = 2 — x + 3x? 
con respecto a la base B = {1 + x, 1 — x, x°} de P,. 


Encuentre el vector coordenado de p(x) = 2 — x + 3x? 
con respecto a la base B = {1,1 + x, —1 + x°} de P.. 


Sea B un conjunto de vectores en un espacio vectorial V 
con la propiedad de que todo vector en V puede escri- 
birse de manera única como una combinación lineal de 
los vectores en B. Pruebe que B es una base para V. 


Sea B una base para un espacio vectorial V, sean u,,..., 
u, vectores en V, y sean c,,..., C, escalares. Demuestre 
que [c 4, ++ CU] =c0 [0 ]g +: + cu). 


Concluya la demostración del Teorema 6.7 al demostrar 


que si [[u; ];, . . ., [uz )s) es linealmente independiente 
en R”, entonces {u}, . . . , up} es linealmente indepen- 
diente en V. 

Sea {u}, . . ., u,,) un conjunto de vectores en un espacio 
vectorial n-dimensional V y sea $ una base para V. Sea 
S = [uz . . ., [u,]s) el conjunto de vectores coorde- 
nados de (u,,...,u,,) con respecto a B. Demuestre que 


gen(u,, ...,Uu,) = V si y sólo si gen(S) = RR”. 


En los ejercicios 34-39, encuentre la dimensión del espacio vec- 
torial V y proponga una base para V. 


34. 
35. 


V = (p(x) en P, : p(0) = 0} 
V = (plx) en P,:p(1) = 0} 


19. V = Ma8 = (| ela el de H) 136. V= [p(x) en P, :xp"(x) = p(a)) 
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37. V= (A en M, : A es triangular superior) 
38. V = {A en M, : A es antisimétrica) 

1 1 
39. V= {A en M, : AB = BA}, donde B = E '] 


40. Encuentre una fórmula para la dimensión del espacio 
vectorial de las matrices simétricas de n X n. 


41. Encuentre una fórmula para la dimensión del espacio 
vectorial de las matrices antisimétricas de n X n. 


42. Sean U y W subespacios de un espacio vectorial de di- 


mensión finita V. Demuestre la identidad de Grassmann: 


dim(U + W) = dimU + dimW — dim(U N W) 


[Sugerencia: el subespacio U + W se definió en el ejerci- 
cio 48 de la sección 6.1. Sea B = {v}, . . . , v,) una base 
para U N W. Extienda B a una base C de U y una base D 
de W. Demuestre que C U D es una base para U + W.] 

43. Sean U y V espacios vectoriales de dimensión finita. 

(a) Encuentre una fórmula para dim(U X V) en térmi- 
nos de dim U y dim V. (Vea el ejercicio 49 de la sec- 
ción 6.1.) 

(b) Si W es un subespacio de V, demuestre que dim A 
= dim W, donde A = {(w, w) : w está en W}. 

44. Demuestre que el espacio vectorial P es de dimensión 
infinita. [Sugerencia: suponga que tiene una base finita. 
Demuestre que existe algún polinomio que no es una 
combinación lineal de esta base.] 


45. Extienda {1 + x, 1 + x + x°} a una base para P.. 


1 1 1 
46. Extienda l f | | | } a una base para M,,. 
0 1j L0 1 


1 0 1 =] 
47. Extienda l | |! k | $ | ) a una base para 
0 ifl 0/ L1 0 


M. 


48. Extienda { i 
0 1 1 0 


OJO 1 f 
, a una base para el espacio 
vectorial de las matrices simétricas de 2 X 2. 
49. Encuentre una base para gen(1, 1 + x, 2x) en P}. 


2x,2x — x?,1—x? 1 


50. Encuentre una base para gen(1 
+ x’) en P. 

51. Encuentre una base para gen(1 — x, x — x’, 1 — x7, 1 
2x + x’) en P. 


1 0 1 
52. Encuentre una base para gen( | | l | 
0 1 1 0 


abla i) eMe 


53. Encuentre una base para gen(sen?x, cos”x, cos 2x) en F. 


54. Sea S = [v;,..., v, ) un conjunto linealmente indepen- 
diente en un espacio vectorial V. Demuestre que si v es 
un vector en V que no está en gen(S), entonces S' = 
{Vi . . -> Vm V} todavía es linealmente independiente. 

55. Sea S = [v;,..., v,) un conjunto generador para un 
espacio vectorial V. Demuestre que si v, está en 
gen(v,, ..., v,-,), entonces S' = [v,,...., v,-¡) todavía 
es un conjunto generador de V. 

56. Demuestre el Teorema 6.10(f). 


57. Sea [v;,..., v,) una base para un espacio vectorial V y 
sean C,, ..., C, escalares distintos de cero. Pruebe que 
{CV . . . , CVn} también es una base para V. 

58. Sea [v;,..., v,) una base para un espacio vectorial V. 
Pruebe que 


{vo Y; + Va Vi F Vo EV... Foe + v} 


también es una base para V. 


Sean ap, 4), ..., Ap N + 1 distintos números reales. Defina 
polinomios p(x), p(x), ..., p(x) mediante 
(x — ao) +=" (x = aj- )(x = 
pi(x) = 


(a; — ao) >: (a; — a;-1)(a; — 


Qi+1) e (x o ap) 


aisi) ** (a; — an) 


Los anteriores se llaman polinomios de Lagrange asociados 
COn ay, A, ..., A. [Joseph-Louis Lagrange (1736-1813) nació 
en Italia pero pasó la mayor parte de su vida en Alemania y 
Francia. Realizó importantes aportaciones a campos como la 
teoría de números, álgebra, astronomía, mecánica y el cálculo 
de variaciones. En 1773, Lagrange fue el primero en propor- 
cionar la interpretación de volumen de un determinante (vea 
el capítulo 4).] 


59. (a) Calcule los polinomios de Lagrange asociados con 
4) =1,a, =2,4,= 3. 
(b) Demuestre, en general, que 


0siiX+j 
pi(a;) = l / 


1 sii=j 
60. (a) Pruebe que el conjunto B = [py(x), p(x), . - -> p(x) } 
de polinomios de Lagrange es linealmente indepen- 
diente en Y, [Sugerencia: establezca c¿p¿(x) +++- 
CP, (x) = 0 y use el ejercicio 59(b).] 
(b) Deduzca que B es una base para P. 


61. Si q(x) es un polinomio arbitrario en P, se deduce del 


ejercicio 60(b) que 


q(x) = Copolx) TONTE CPy(x) (1) 
para algunos escalares Co, . . . , Cy. 


m 


(a) Demuestre que para i = 0,. . ., n, c; = q(a;) y deduzca 


que q(x) = q(ao)po(x) +: + q(a,)p,(x) es la repre- 
sentación única de q(x) con respecto a la base B. 


(b) Demuestre que, para cualesquier n + 1 puntos (ap 


(c) 


Co), (Ap C,), ..., (a, c,) con distintos primeros com- 
ponentes, la función q(x) definida por la ecuación 
(1) es el polinomio de grado único cuando mucho n 
que pasa a través de todos los puntos. Esta fórmula 
se conoce como la fórmula de interpolación de La- 
grange. (Compare esta fórmula con el problema 19 
de la Exploración: Aplicaciones geométricas de los 
determinantes, en el capítulo 4.) 

Use la fórmula de interpolación de Lagrange para 
encontrar el polinomio de grado cuando mucho 2 
que pasa a través de los puntos 
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62. 


63. 


(1) (1; 6), (2, =1), y (3; =2) 
Use la fórmula de interpolación de Lagrange para de- 
mostrar que, si un polinomio en Y, tiene n + 1 ceros, 
entonces debe ser el polinomio cero. 


Encuentre una fórmula para el número de matrices in- 
vertibles en M,,,(Z,). [Sugerencia: esto es igual que de- 
terminar el número de bases diferentes para Z}. (¿Por 
qué?) Cuente el número de formas para construir una 


base para Zp, un vector a la vez.] 
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Cuadrados mágicos 


El grabado que se muestra en la página 479 es Melancolía I (1514), de Albrecht Dürer. 
Entre los muchos artefactos matemáticos de este grabado está el cuadro de números que 
cuelga en la pared de la esquina superior derecha. (Se muestra agrandado en el inserto 
ilustrado.) Tal arreglo de números se conoce como cuadrado mágico. Puede considerarse 
como una matriz de 4 X 4 


16 3 2 13 


5 10 11 8 
9 6 7 12 
4 15 14 1 


Observe que los números en cada renglón, en cada columna y en ambas diagonales tie- 
nen la misma suma: 34. Observe también que las entradas son los enteros 1, 2,....., 16. 
(Note que Diirer colocó el 15 y el 14 uno junto al otro en el último renglón, lo que da la 
fecha del grabado.) Estas observaciones condujeron a la siguiente definición. 


Definición Una matriz M de n X n se conoce como cuadrado mágico si la suma 
de las entradas es la misma en cada renglón, cada columna y ambas diagonales. Esta 
suma común se llama el peso de M, que se denota wt(M). Si M es un cuadrado má- 
gico de n X n que contiene cada una de las entradas 1,2, . . . , n? exactamente una vez, 
entonces M se llama cuadrado mágico clásico. 


1. Si Mes un cuadrado mágico clásico de n X n, demuestre que 


n(n? + 1) 


wt(M) = 7 


[Sugerencia: use el ejercicio 51 de la sección 2.4.] 


2. Encuentre un cuadrado mágico clásico de 3 X 3. Encuentre uno diferente. ¿Sus 
dos ejemplos se relacionan en alguna forma? 


O Burstein Collection/CORBIS 
O Burstein Collection/CORBIS 


3. Claramente, la matriz de 3 X 3 con todas las entradas iguales a 3 es un cuadrado 
mágico con peso 1. Con su respuesta al problema 2, encuentre un cuadrado mágico de 
3 X 3 con peso 1, cuyas entradas sean todas diferentes. Describa un método para construir 
un cuadrado mágico de 3 X 3 con distintas entradas y peso w para cualquier número 
real w. 


Sea Mag, el conjunto de todos los cuadrados mágicos de n X n, y sea Mag? el conjunto 
de todos los cuadrados mágicos de n X n de peso 0. 


4. (a) Demuestre que Mag, es un subespacio de M,,. 
(b) Demuestre que Mag%es un subespacio de Mag). 
5. Uselos problemas 3 y 4 para demostrar que si M es un cuadrado mágico de 3 X 
3 con peso w, entonces puede escribir M como 
M=M,+K 


donde M, es un cuadrado mágico de 3 X 3 de peso 0, J es la matriz de 3 X 3 que consiste 
por completo de números 1 y k es un escalar. ¿Cuál debe ser k? [Sugerencia: demuestre 
que M — kJ está en Mag? para un valor adecuado de k.] 


Ahora se intentará encontrar una forma de describir todos los cuadrados mágicos de 
3 X 3.Sea 


abc 
M=ļ|d e f 
g h i 


un cuadrado mágico con peso 0. Las condiciones en los renglones, columnas y diagona- 
les dan lugar a un sistema de ocho ecuaciones lineales homogéneas con las variables a, 


Discos to 


6. Escriba este sistema de ecuaciones y resuélvalo. [Nota: usar un CAS facilitará los 
cálculos. | 


419 


480 


7. Encuentre la dimensión de Mag?. Sugerencia: al hacer una sustitución, si es 
necesario, use su solución al problema 6 para demostrar que M puede escribirse en la 
forma 


S il Í 
M=|-s+t 0 2 
8 STE S 


8. Encuentre la dimensión de Mag,. [Sugerencia: combine los resultados de los 
problemas 5 y 7.] 


9. ¿Puede encontrar una forma directa de demostrar que la entrada (2, 2) de un 
cuadrado mágico de 3 X 3 con peso w debe ser w/3? [Sugerencia: sume y reste ciertos 
renglones, columnas y diagonales para dejar un múltiplo de la entrada central. ] 


10. Sea M un cuadrado mágico de 3 X 3 de peso 0, obtenido a partir de un 
cuadrado mágico clásico de 3 X 3, como en el problema 5. Si M tiene la forma dada en 
el problema 7, escriba una ecuación para la suma de los cuadrados de las entradas de M. 
Demuestre que esta es la ecuación de una circunferencia con las variables s y t, y 
grafíquela cuidadosamente. Demuestre que existen exactamente ocho puntos (s, t) en 
esta circunferencia con s y t enteros. Con el problema 8, demuestre que estos ocho pun- 
tos dan lugar a ocho cuadrados mágicos clásicos de 3 X 3. ¿Cómo se relacionan mutua- 
mente estos cuadrados mágicos? 
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En muchas aplicaciones, un problema descrito en un sistema coordenado puede resol- 
verse más fácilmente al cambiar a un nuevo sistema coordenado. Este cambio por lo ge- 
neral se logra al realizar un cambio de variables, un proceso que probablemente usted 
encontró en otros cursos de matemáticas. En álgebra lineal, una base proporciona un sis- 
tema coordenado para un espacio vectorial, mediante la noción de vectores coordena- 
dos. La elección de la base correcta con frecuencia simplificará enormemente un pro- 
blema particular. Por ejemplo, considere la estructura molecular del zinc, que se muestra 
en la figura 6.3(a). Un científico que estudia el zinc acaso quiera medir las longitudes de 
los enlaces entre los átomos, los ángulos entre dichos enlaces, etcétera. Tal análisis se fa- 
cilitará enormemente al introducir coordenadas y utilizar las herramientas del álgebra 
lineal. La base estándar y los ejes coordenados estándar asociados xyz no siempre son la 
mejor opción. Como muestra la figura 6.3(b), en este caso probablemente {u, v, w} sea 
una mejor opción de base para R? que la base estándar, pues dichos vectores se alinean 
muy bien con los enlaces entre los átomos de zinc. 


La figura 6.4 muestra dos sistemas coordenados diferentes para R? y cada uno surge de 
una base diferente. La figura 6.4(a) muestra el sistema coordenado relacionado con la 
base B = {u}, w}, mientras que la figura 6.4(b) surge de la base C = [v,, v2}, donde 


-Alo-b- 


El mismo vector x se muestra en relación con cada sistema coordenado. Es claro a 
partir de los diagramas que los vectores coordenados de x con respecto a B y C son 


E 


respectivamente. Se evidencia que existe una conexión directa entre los dos vectores co- 
ordenados. Una forma de encontrar la relación es usar [x]y para calcular 


ena] Je Jl 
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y y 
A A 
2 e 
va 
se 4 
E s | l | | x 
=2 4 6 
—=2 ÉS 
Y a X 
(a) (b) 


Figura 6.4 


Entonces puede encontrar [x]¿ al escribir x como una combinación lineal de v, y v,. Sin 
embargo, existe una mejor forma de proceder, una que proporcionará un mecanismo 
general para tales problemas. Este planteamiento se ilustra en el siguiente ejemplo. 


Ejemplo 6.45 


1 
Con las anteriores bases B y C, encuentre [x]¿, dado que [x]y = o | 


Solución Puesto que x = u, + 3u,, escribir u, y u, en términos de v, y v, dará las coor- 
denadas requeridas de x con respecto a C. Se encuentra que 


1 1 [1 
"=| |- -h +2 |= -av + av, 
2 0 11 


2 1 [1 
y u = Zj =a 1 = 3v, — Y 


de modo que 


= (—3w, + 2v,) + 3(3v, — v2) 


Esto produce 


lo que concuerda con la figura 6.4(b). | 


Este método puede no parecer más sencillo que el sugerido antes del ejemplo 6.45, 
pero tiene una gran ventaja. Ahora puede encontrar [y]¿ a partir de [y | para cualquier 
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vector y en R? con muy poco trabajo adicional. Observe los cálculos del ejemplo 6.45 
desde un punto de vista diferente. A partir de x = u, + 3u,, se tiene 


[x]e = [u, + 3w]e = [w]e + 3[w]e 


por el Teorema 6.6. En consecuencia, 


donde P es la matriz cuyas columnas son [u; ]e y [u>]¿. Este procedimiento se generaliza 
bastante bien. 


Definición Sean 8 = {u,,... ,u,} yC = (v,,... ,v,) bases para un espacio vec- 
torial V. La matriz de n X n cuyas columnas son los vectores coordenados [u;] ¿,..., 
[u,]¿ de los vectores en 5 con respecto a C se denota Pc. y y se llama matriz de cam- 
bio de base B a C. Esto es, 


Pecs = [lu lelule = [u,le] 


Piense en B como la base “antigua” y en C como la base “nueva”. Entonces las colum- 
nas de Peg son justo los vectores coordenados obtenidos al escribir los vectores de la 
base antigua en términos de los nuevos. El Teorema 6.12 muestra que el ejemplo 6.45 es 
un caso especial de un resultado general. 


Teorema 6.12 


Sean B = (u,... ,u,) yC = {Vp . - -> V„} bases para un espacio vectorial V y sea Peg 
la matriz de cambio de base B a C. Entonces 


a. Pecglx]s = [x]c para todo x en V. 
b. Pe. y es la matriz única P con la propiedad de que P[x]g = [x]¿ para todo x en V. 
C. Per es invertible y (E = Prec. 


Demostración (a) Sea xen V y sea 


Esto es, x = cu, +++ + c,u,. Entonces 


non” 


[x]e = [au + + c,0, Je 


II 
= 
= 

f= 
£ 
Ea 
a 
— 

E 
= 
es 
S 
La 
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(b) Suponga que P es una matriz de n X n con la propiedad de que P[x] p = [x]¿ para 
todo x en V. Al tomar x = u, el i-ésimo vector base en B, se ve que [x] y = [u;] y = e, de 
modo que la 1-ésima columna de P es 


p; = Pe; = Plu,]z = [w]e 


que es la i-ésima columna de Peg, por definición. Se tiene que P = Poeg- 


(c) Dado que {u}, . . . , u„} es linealmente independiente en V, el conjunto { [u,]¿,..., 
[u„]e} es linealmente independiente en R”, por el Teorema 6.7. En consecuencia, 
Peg = [[u]e =] [u]e ]es invertible, por el teorema fundamental. 


Para todo x en V, se tiene Peo g|X]g = [x]¿. Al resolver para [x]y, se encuentra que 


[x]s = (Pecs) [xl 
para todo x en V. Por tanto, (Peg) ' es una matriz que cambia bases de C a B. Por 
tanto, por la propiedad de unicidad (b), debe tener (Peg) | = Pgec- M 


Comentarios 

e Puede encontrar útil considerar al cambio de base como una transformación (de 
hecho, es una transformación lineal) de R” a sí mismo que simplemente cambia de un 
sistema coordenado a otro. La correspondiente transformación a P¿.g acepta [x]y 
como entrada y regresa [x] como salida; (Peg)? = Pgec hace justo lo opuesto. La 
figura 6.5 ofrece una representación esquemática del proceso. 


X 
. 


V 
[ a eo 
Multiplicación 


por Pe-B 


A 
R” y R” 


Figura 6.5 Multiplicación 
Cambio de base por Pg=¿ = (P CB)? 


+ Las columnas de P¿. y son los vectores coordenados de una base con respecto a 
la otra base. Para recordar cuál base es cuál, piense en la notación C<— B como decir “8 
en términos de C”. También es útil recordar que Pc. g|X]g es una combinación lineal de 
las columnas de Pep. Pero, dado que el resultado de esta combinación es [x]e, las 
columnas de P¿._g deben ser los vectores coordenados con respecto a C. 


Ejemplo 6.46 


> 


Encuentre las matrices de cambio de base P¿._ y y Pgo ç para las bases B = {1, x, x°} yC = 
[1 +x x + x’, 1 + x? de P,. Luego encuentre el vector coordenado de p(x) = 1 + 2x 
— x° con respecto a C. 


Solución Cambiar una base estándar es sencillo, de modo que primero se encuentra 
Pgec. Observe que los vectores coordenados para C en términos de B son 


1 0 1 
[1+xJB=|1 | [x+x*%U¿=|1|, [1+x?*]¿=|0 
0 1 1 
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(Vuelva a leer el Comentario después del ejemplo 6.26.) Se tiene que 
1 0 1 
P BC 7 1 1 0 
0 1 1 


Para encontrar Pc. g podría expresar cada vector en B como una combinación lineal 
mM=-> de los vectores en C (hágalo), pero es mucho más fácil usar el hecho de que 
Peg = (Prec) * por el Teorema 6.12(c). Se encuentra que 


1 1 1 
2 2 2 
Pecs = (Psc) =| -3 3 4 
E 
Ahora se tiene que 
[p() le = Pecslo() e 
1 mol 
2 2 2 
=|= 312 
Li 1 = 
2 2 2 
2 
= 0 
=1 
lo que concuerda con el ejemplo 6.37. | 


Comentario Si no se necesita Peg de manera explícita, puede encontrar [p(x) Je a 
partir de [p(x) ]x y Pg usando eliminación gaussiana. La reducción por renglón pro- 
duce 


[Prec | [p(0)1s] — I| Pe-e) "lp60 ls] = [11 Pecelo(0) ls] = H e] 


(Vea la siguiente sección acerca del uso de la eliminación de Gauss-Jordan.) 

Vale la pena repetir el comentario del ejemplo 6.46: cambiar a una base estándar es 
sencillo. Si € es la base estándar para un espacio vectorial V y B es cualquiera otra base, 
entonces las columnas de Pg. son los vectores coordenados de B con respecto a €, y 
ellas por lo general son “visibles”. En el siguiente ejemplo se usa nuevamente este co- 
mentario. 


Ejemplo 6.47 En M,,, sea B la base (E, ,, E21 E,,, E22} y sea C la base {A, B, C, Dj, donde 
1.0 1 1 1 1 1 1 
asla ob a=lo o) e= ob ol 
0 0 0 0 1 0 1 1 
Encuentre la matriz de cambio de base Peug y verifique que [X]e = PeglX]g para 


s 
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Solución 1 Para resolver este problema directamente, debe encontrar los vectores coor- 
denados de $ con respecto a C. Esto involucra resolver cuatro problemas de combinación 
lineal de la forma X = aA + bB + cC + dD, donde X está en B y debe encontrar a, b, c y 
d. Sin embargo, aquí se tiene suerte, pues puede encontrar los coeficientes requeridos por 
inspección. 

Claramente, E,, = A, E = —B + C, Ep = —A + ByE, = -C + D. Por tanto, 


1 0 =1 0 

0 =1 1 0 

[Ele = ob [Ez le = LP [Ez le = o |* [Ez le = —] 

0 0 0 1 
1 0 =1 0 
0: -=1 1 0 

de modo que Peg = [[ Ele [En]e [En]e [Ele] = 0 1 0 -1 
0 0 0 1 


l | 1 A 
SIX = , entonces 
3 4 


1 
3 
Kly = 
[X]s : 
4 
i o-i 011 -1 
palt T E OP A 
dl CERE E JE -1 
o o o 1Jla 4 


Éste es el vector coordenado con respecto a C de la matriz 
1 0 1 1 1 1 1 1 
=A-B-C+4D=- - - +4 | 
0 0 0 0 1 0 1 1 
BA 
= =X 
3 4 


como debe ser. 


Solución 2 Puede calcular Peg en una forma diferente, del modo siguiente. Como se 
le pedirá probar en el ejercicio 21, si € es otra base para M,,, entonces Peg = 
PecsPecg= (Pece) "Peeg. Si E es la base estándar, entonces Pe. g y Pee pueden en- 
contrarse por inspección. Se tiene 


Peg = y Peec i 


oO oO O me 
Oroso 
o o. o 
= O O O 
O O O m 
O OŘ. m. 
O =. = m 
= = = = 
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m=>  (;Ve por qué?) Por tanto, 


Pere = (Pere) Pees 
1.1 1 1 [1 00.0 
(6.111 0010 
i 
0001 0.0.0 1 
1-1 0 ol[1000 
lo 1-1 0[[0.0 10 
lo o 1 -1||01 00 
o o o 1iJlo0.0 1 
1 0 -1 0 
(o -1 1.0 
SH 0-1 
0 0 0 1 


lo que concuerda con la primera solución. 


m. 


Comentario El segundo método tiene la ventaja de no necesitar el cálculo de algu- 
nas combinaciones lineales. Tiene la desventaja de requerir que se encuentre un inverso 
matricial. Sin embargo, usar un CAS facilitará el hallazgo de dicho inverso, de modo que, 
en general, el segundo método es preferible al primero. No obstante, para ciertos pro- 
blemas, el primer método puede usarse con igual facilidad. En cualquier caso, está a 
punto de describirse un tercer método, que puede resultar ser el mejor de todos. 


Encontrar la matriz de cambio de basa a una base estándar es sencillo y puede hacerse 
por inspección. Encontrar la matriz de cambio de base a partir de una base estándar es 
casi igual de sencillo, pero requiere el cálculo de una matriz inversa, como en el ejemplo 
6.46. Si se hace a mano, entonces (excepto para el caso de 2 X 2) por lo general se en- 
contrará la inversa necesaria mediante eliminación de Gauss-Jordan. Ahora observe una 
modificación del método de Gauss-Jordan que puede usarse para encontrar la matriz de 
cambio de base entre dos bases no estándar, como en el ejemplo 6.47. 


Suponga que B =¿fu,,...,u,pyC = (v,...,v,) son bases para un espacio vecto- 
rial V y Peg es la matriz de cambio de base de B a C. La ¡-ésima columna de P es 
Pii 
[u] =| : 
Pni 


de modo que u; = pV; + *** + Pp V, Si € es cualquier base para V, entonces 
[u;]: => [PV qori PniVnle = Prl vie pint Pril Vnle 
Esto puede reescribirse en forma matricial como 


Pri 
[vile + [vae] : | = [we 
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que ahora puede resolverse al aplicar la eliminación de Gauss-Jordan a la matriz au- 
mentada 


[vie «> [vale | [ue] 


Existen n de tales sistemas de ecuaciones por resolver, una para cada columna de Po. y, 
pero la matriz de coeficientes [[w,]¿ = [w,]e] es la misma en cada caso. Por tanto, 
puede resolver todos los sistemas simultáneamente al reducir por renglón la matriz au- 
mentada de n X 2n 


[vie ++ [Vae [ui Je ++ [u,]e] = [C |B] 


Dado que {Yr - - -> Vn} es linealmente independiente, también lo es ([v,),, ......[v,]+ por 
el Teorema 6.7. Por tanto, la matriz C cuyas columnas son ([v,],, . . -> [v, ],) tiene la 
matriz identidad I de n X n para su forma escalonada reducida por renglón, por el teo- 
rema fundamental. Se tiene que la eliminación de Gauss-Jordan necesariamente producirá 


[C|B] >[1|P] 


donde P = Peg. 
Se acaba de demostrar el siguiente teorema. 


Teorema 6.13 


Sean B =XJu,...,u,) y C = [v,,..., v,) bases para un espacio vectorial V. Sean 
B= [[u e = [u,]e] y C= [lvile = [v,]£], donde € es cualquier base para 
V. Entonces la reducción por renglón aplicada a la matriz aumentada [|C | B] de n X 
2n produce 


[C|B] >[1| Pecs] 


Si € es una base estándar, este método es particularmente fácil de usar, pues en dicho 
caso B = Peg y C = Peec. Este método se ilustra al volver a trabajar el problema del 
ejemplo 6.47. 


Ejemplo 6.48 


Vuelva a resolver el ejemplo 6.47 usando el método de Gauss-Jordan. 


Solución Al tomar € como la base estándar para M,,, se ve que 


1 0 0 0 1 1 1 1 
E y 0 0 1 0 y DER. 0 1 1 1 
f 0 100 0 0 1 1 
0 0 0 1 0 0 0 1 
La reducción por renglón produce 
1 1 1 111.0 00 1000 0—1 0 
6 1 1 1001 0 o 1 0 00 -1 1 0 
[C|B] = — 
0 0O 1 1/0 1 0 0 0 0 1 0/0 0 —1 
0 0 0 1/0 0 O 1 0 0 0 1 0 0 1l 


(Verifique esta reducción por renglón.) Se tiene que 
1. 0-1 0 


0 =I 1 0 
Peg = 


como se encontró anteriormente. i 
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3 |Hercicios 6.3 


En los ejercicios 1-4: 

(a) Encuentre los vectores coordenados [x]g y [X]¿ de x con 
respecto a las bases B y C, respectivamente. 

(b) Encuentre la matriz de cambio de base Peg de B a C. 
(c) Use su respuesta al inciso (b) para calcular [x]¢, y com- 
pare su respuesta con la que encontró en el inciso (a). 

(d) Encuentre la matriz de cambio de base Pg ç de C a B. 
(e) Use sus respuestas a los incisos (c) y (d) para calcular 
[x]g, y compare su respuesta con la que encontró en el 
inciso (a). 


1 0 
ler 
=] 1 
1 0 0 
3.x = 0 ,B = 0 > 11, 0 > 
—1 0 0 
1 0 0 
C= 11110 p¿enR? 
1 1 1 
1 0 0 1 
4.x= 2 „B= 11, 0 > 0 > 
3 0 1 0 
en R? 


En los ejercicios 5-8, siga las instrucciones para los ejercicios 1- 
4y use p(x) en lugar de x. 
5. p(x) =2 — x, B = {1,x},C = {x, 1 + x} en P; 
6. p(x) = 3 + 2x, B = {1 +x, 1 — x}, 
C = {2x, 3) en P, 
Tep) =1 + xb ataa ta h 
C={1,x, x} en P, 
Lio =2=2:+3B=ll221 taata h 
C={1,x,1 +x + x’}en P, 


En los ejercicios 9 y 10, siga las instrucciones para los ejercicios 
1-4 y use A en lugar de x. 

4 
0 


AN 
a- 


2 
9.A= | B | B = la base estándar, 


En los ejercicios 11 y 12, siga las instrucciones para los ejerci- 
cios 1-4 y use f(x) en lugar de x. 


11. f(x) = 2sen x — 3 cos x, B = [sen x + cos x, cos x}, 

C = {sen x + cos x, sen x — cos x} en gen (sen x, cos x) 
12. f(x) = cos x, B = {sen x, sen x + cos x}, 

C = {sen x + cos x, sen x — cos x} en gen (sen x, cos x) 


1 


W 


. Rote el eje xy en el plano en sentido contrario al de las 
manecillas del reloj un ángulo 9 = 60° para obtener 
nuevos ejes x'y”. Use los métodos de esta sección para 
encontrar (a) las coordenadas x'y” del punto cuyas co- 
ordenadas xy son (3, 2) y (b) las coordenadas xy del 
punto cuyas coordenadas x'y” son (4,—4). 


14. Repita el ejercicio 13 con 0 = 135°. 


1 2 
. Sean B y C bases para R°. Si C = El A) a 


1 


191] 


matriz de cambio de base de BaC es 


1 3] 
=] 2 
encuentre b. 


16. Sean B y C bases para P,. Si B = {x,1 +x, 1 — x +x} 
y la matriz de cambio de base de B a C es 


Peg = | 


1 0 0 
Peck = 0 2 1 
-=1 1 1 


encuentre C. 
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En cálculo se aprende que un polinomio de Taylor de grado 
n en torno a a es un polinomio de la forma 


p(x) =a + a(x — a) + alx— a) +: + a(x -— a)" 
donde a, + 0. En otras palabras, es un polinomio que se ex- 
pandió en términos de potencias de x — a en lugar de potencias 
de x. Los polinomios de Taylor son muy útiles para aproximar 
funciones que “se comportan bien” cerca de x = a. 


El conjunto B = {1, x — a, (x — a)?,...,(x— a)”) es una 
base para P,, para cualquier número real a. (¿Percibe una 
forma rápida de demostrar esto? Intente usar el Teorema 6.7.) 
Este hecho permite usar las técnicas de esta sección para rees- 
cribir un polinomio como un polinomio de Taylor en torno a 
una a dada. 


17. Exprese p (x) = 1 + 2x — 5x* como un polinomio de 
Taylor en torno a a = 1. 


18. Exprese p(x) = 1 + 2x — 5x7 como un polinomio de 
Taylor en torno a a = —2. 


19. Exprese p (x) = xX como un polinomio de Taylor en 
tornoaa = —1. 


20. Exprese p (x) = x? como un polinomio de Taylor en 
tornoaa =}. 


21. Sean B, C y D bases para un espacio vectorial V de di- 
mensión finita. Pruebe que 


PpecPeeg = Ppeg 


22. Sea V un espacio vectorial de dimensión n con base 


B = {v ..., V„}. Sea una matriz invertible de n X n y 
establezca 

u; = Priv penp PniYn 
parai = 1,...,n. Pruebe que C = {u;,..., u,} es una 


base para V y demuestre que P = Pc. 


Transformaciones lineales 


En la sección 3.6 se encontraron las transformaciones lineales en el contexto de las trans- 


formaciones matriciales de R” a R”. En esta sección se amplía este concepto a transfor- 
maciones lineales entre espacios vectoriales arbitrarios. 


Definición Una transformación lineal de un espacio vectorial V a un espacio 
vectorial W es un mapeo T : V — W tal que, para todo u y v en V y para todos los es- 


calares c, 


1. T(u + v) = T(u) + T(v) 


2. T(cu) = cT (u) 


Es directo demostrar que esta definición es equivalente al requisito de que T con- 
serve todas las combinaciones lineales. Esto es, 


T: V> W es una transformación lineal si y sólo si 


T(civi + eva t E av) O Ac) 


para todo v}, ... 


, v, en V y escalares cri Cp. 
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> 


Toda transformación matricial es una transformación lineal. Esto es, si A es una matriz 


de m X n, entonces la transformación T, : R"—> R” definida por 
A p 


T,(x) = Ax para x en R” 


es una transformación lineal. Éste es un nuevo planteamiento del Teorema 3.30. 


mE 
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| le 


Ejemplo 6.50 Defina T : M,,, >M,,, mediante T(A) = A”. Demuestre que T es una transformación li- 
neal. 
Solución Se comprueba que, para A y B en M,, y escalares c, 
T(A + B) = (A + B)" = A” + B" = T(A) + T(B) 
y T(cA) = (cA)" = cA" = cT(A) 
Por tanto, T es una transformación lineal. | 
| > 


Ejemplo 6.51 Sea D el operador diferencial D : D — F definido por D(f) = f'. Demuestre que D es 
una transformación lineal. 


Solución Sean f y g funciones derivables y sea c un escalar. Entonces, a partir del 
cálculo, se sabe que 


D+2=(+2 "=P +g = DUO) + Dl) 


y D(f) =($) =f' = D(f) 


Por tanto, D es una transformación lineal. 


-t 


En cálculo se aprende que toda función continua en [a, b] es integrable. El siguiente 
ejemplo demuestra que la integración es una transformación lineal. 


| e 


Ejemplo 6.52 Defina S: €[ a, b] —> R mediante S(f) = f? f(x)dx. Demuestre que S es una transfor- 
mación lineal. 


Solución Sean fy g en €[a, b]. Entonces 


sta) = | GHD 


a 


Se tiene que S es lineal. | 
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Ejemplo 6.54 


Demuestre que ninguna de las siguientes transformaciones es lineal: 
(a) T: M, > R definida por T(A) = det A 

(b) T: R>R definida por T(x) = 2* 

(c) T:R— R definida por T(x) =x + 1 


Solución En cada caso se ofrece un contraejemplo específico para demostrar que una 
de las propiedades de una transformación lineal no se cumple. 


1 0 0 0 1 0 
(a) Sean A = | SR D |, Entonces a+B=l P |, de modo que 


0 0 
1 0 
T(A +B) = de(A+8B)=|, ,|=1 
Pero 
1 0 0 0 
T(A) + T(B) = detA + detB = | |- 0 ¡AFRO 


de modo que T(A + B) + T(A) + T(B) y T no es lineal. 
(b) Sean x = 1 y y = 2. Entonces 


T(x + y) = T(3) = Ż =8 + 6 = 2 +2 = T(x) + T(y) 


de modo que T no es lineal. 
(c) Sean x = 1 yy = 2. Entonces 
T(x + y) =T(B)=3+1=4%5=(1+1)+(Q+1)= T(x) + T(y) 


Por tanto, T no es lineal. | 


Comentario El ejemplo 6.53(c) demuestra que es necesario tener cuidado cuando 
uno encuentra la palabra “lineal”. Como función, T(x) = x + 1 es lineal, pues su gráfica 
es una recta. Sin embargo, no es una transformación lineal del espacio vectorial R por sí 
misma, pues falla en satisfacer la definición. (¿Qué funciones lineales de R a R también 
serán transformaciones lineales?) 


Existen dos transformaciones lineales especiales que merecen distinguirse. 


(a) Para cualesquier espacios vectoriales V y W, la transformación T, : V —> W que 
mapea todo vector en V al vector cero en W se llama transformación cero. Esto es, 


T,/(v) =0 para todo v en V 


(b) Para cualquier espacio vectorial V, la transformación I : V—> V que mapea todo vec- 
tor en V a sí mismo se llama transformación identidad. Esto es, 


I(v) =v para todo ven V 


(Si es importante identificar el espacio vectorial V, puede escribir Iy por claridad.) Las 
demostraciones de que las transformaciones cero e identidad son lineales se dejan como 


ejercicios sencillos. | 
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Propiedades de las transformaciones lineales 


En el capítulo 3, todas las transformaciones lineales eran transformaciones matriciales, 
y sus propiedades se relacionaban directamente con propiedades de las matrices involu- 
cradas. El siguiente teorema es fácil de demostrar para transformaciones matriciales. 
(¡Hágalo!) La demostración completa para transformaciones lineales en general re- 
quiere un poco más de cuidado, pero todavía es directa. 


Teorema 6.14 


Sea T: V — W una transformación lineal. Entonces: 


a. T(0)=0 
b. T(+v) = —T(v) para todo v en V. 
c. T(u — v) = T(u) — T(v) para todo u y ven V. 


Demostración Se demuestran las propiedades (a) y (c) y se deja la demostración de la 
propiedad (b) como ejercicio 21. 


(a) Sea v cualquier vector en V. Entonces T(0) = T(0v) = OT (v) = 0, como se requiere. 
(¿Puede dar una razón para cada paso?) 


(c) T(u — v) = T(u + (—1)v) = T(u) + (—1)T(v) = T(u) — T(v) E 3 


Comentario La propiedad (a) puede ser útil para demostrar que ciertas transfor- 
maciones no son lineales. Como ilustración, considere el ejemplo 6.53(b). Si T(x) = 2%, 
entonces T(0) = 2° = 1 + 0, de modo que T no es lineal, por el Teorema 6.14(a). Sin em- 
bargo, tenga cuidado, pues existen muchas transformaciones que sí mapean el vector 
cero al vector cero, mas todavía no son lineales. El ejemplo 6.53(a) es un caso a la medida: 
el vector cero es la matriz cero O de 2 X 2, de modo que T(O) = det O = 0, pero se vio 
que T(A) = det A no es lineal. 


La propiedad más importante de una transformación lineal T: V— W es que T está 
completamente determinada por su efecto sobre una base para V. El siguiente ejemplo 
demuestra lo que esto significa. 


Suponga que T es una transformación lineal de R? a P, tal que 


r| =2-3+ y j=- 
1 3 


ncuentre ý 
j 2| [b 


Solución Dado que B = l i 


2 
i 2] ) es una base para R? (¿por qué?), todo vector en 


R? está en gen(B). Al resolver 
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se encuentra que C, = —7 y C, = 3. Por tanto, 
=1 1 2 
{ale 
2 1 3 
1 2 
rr, | + arf} 
1 3 


= —7(2 — 3x + x°) + 3(1 — x?) 
—11 + 21x — 10x? 


De igual modo, se descubre que 


(]-0-o(1]»0-o[ 
¡A 


(Ba — ari yb- ari? 
= (3a — 2b)(2 — 3x + x°) + (b — aJ(1 — x°) 
= (5a — 3b) + (—9a + 6b)x + (4a — 3b)x? 


de modo que 


1, 


=] 
(Note que, al hacer a = —1 y b = 2, se recupera la solución r| 2] = =]] + 21x 


— 10x?.) 


La demostración del teorema general es bastante directa. 


Teorema 6.14 


Sea T: V—> W una transformación lineal y sea B = {v}, . . . , v,) un conjunto genera- 
dor para V. Entonces T(B) = (T(v,),..., T(v,)| genera el rango de T. 


Demostración El rango de T es el conjunto de todos los vectores en W que son de la 
forma T(v), donde v está en V. Sea T(v) que está en el rango de T. Dado que B genera a 
V, existen escalares c, ..., c€, tales que 


V= CV ++ CV, 
Al aplicar T y usar el hecho de que es una transformación lineal, se ve que 
T(v) = Thav ++ cv) = 01 T(v,) +: + Tva) 
En otras palabras, T(v) está en gen(T(B)), como se requiere. | 
El Teorema 6.15 se aplica, en particular, cuando B es una base para V. Puede supo- 


ner que, en este caso, T(B) sería entonces una base para el rango de T. Por desgracia, este 
no siempre es el caso. Este conflicto se abordará en la sección 6.5. 


Composición de transformaciones lineales 


En la sección 3.6 se definió la composición de transformaciones matriciales. La defini- 
ción se extiende a transformaciones lineales generales en una forma obvia. 


SoT se lee “S de T? 
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Definición siT:U— VyS:V— W son transformaciones lineales, entonces la 


composición de S con T es el mapeo S ° T, definido por 
(S° T)(u) = S(T(u)) 


donde u está en U. 


Observe que S ° T es un mapeo de U a W (vea la figura 6.6). Note también que, para 
que la definición tenga sentido, el rango de T debe estar contenido en el dominio de S. 


SeT 
0, E A w 
m =>/ Tu) => S(T(w) = (S° Tu) 


Composición de transformaciones lineales 


Sean T: R2>P, y S: P, >P, transformaciones lineales definidas por 


nel =a+(a+b)x y S(p(x) =xp(x) 
Encuentre (S o m3 y(So | 


Solución Calcule 


enj i =s(1 2|) =r 0 Nea 


= 3x + x? 


(So m5] = s( lel) = S(a + (a + b)x) = x(a + (a + b)x) 
= ax + (a + b)x? 


i 


El capítulo 3 demostró que la composición de dos transformaciones matriciales era 
otra transformación matricial. En general, se tiene el siguiente teorema. 


Teorema 6.16 


Si T: U — Vy S: V—> W son transformaciones lineales, entonces S ° T: U —> W es 
una transformación lineal. 
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Demostración Sean u y v que están en U y sea c un escalar. Entonces 
(So T)(u + v) = S(T(u + v)) 
= S(T(u) + T(v)) pues T es lineal 
= S(T(u)) + S(T(v)) pues S es lineal 
= (S° T)(u) + (S ° T)(v) 


y (S° T)(cu) = S(T(cu)) 
= S(cT(u)) pues T es lineal 
= cS(T(u)) pues S es lineal 
= c(S° T)(u) 
Por tanto, S ° T es una transformación lineal. _ | 


Las propiedades algebraicas de las transformaciones lineales imitan las de las trans- 
formaciones matriciales, que, a su vez, se relacionan con las propiedades algebraicas de 
las matrices. Por ejemplo, la composición de las transformaciones lineales es asociativa. 
Esto es: si R, S y T son transformaciones lineales, entonces 


R° (S° T) =(R°S)°T 


siempre que dichas composiciones tengan sentido. La demostración de esta propiedad es 
idéntica a la dada en la sección 3.6. 

El siguiente ejemplo ofrece otra útil propiedad (más no sorprendente) de las trans- 
formaciones lineales. 


Ejemplo 6.57 


> 
Sean S: U—> V y T: V— W transformaciones lineales y sea I : V — V la transformación 
identidad. Entonces, para todo v en V, se tiene 


(T° D(v) = T((v)) = Tv) 


Dado que T ° I y T tienen el mismo valor en todo v en su dominio, se tiene que T ° I = 


T. De igual modo, I ° S = S. | 


Comentario El método del ejemplo 6.57 no vale nada. Suponga que quiere demos- 
trar que dos transformaciones lineales T, y T, (ambas de V a W) son iguales. Es sufi- 
ciente con demostrar que T,(v) = T,(v) para todo v en V. 


En los ejercicios se exploran más propiedades de las transformaciones lineales. 


Inversas de transformaciones lineales 


Definición Una transformación lineal T : V > W es invertible si existe una 


transformación lineal T' : W>— V tal que 


E, y TO= hy 


En este caso, T” se llama inversa de T. 
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Observaciones 

+ El dominio Vy el codominio W de T no tienen que ser lo mismo, como lo son en 
el caso de las transformaciones matriciales invertibles. Sin embargo, en la siguiente sec- 
ción se verá que V y W deben estar estrechamente relacionados. 

+ Fl requisito de que T” sea lineal podría omitirse de esta definición. Porque, como 
se verá en el Teorema 6.24, si T” es cualquier mapeo de Wa V tal que T' ° T = Iyy T° T' 
= Į entonces T’ también está forzado a ser lineal. 

+ SiT es una inversa de T, entonces la definición implica que T es una inversa de 
T'. Por tanto, T’ también es invertible. 


Verifique que los mapeos T : R? —> P, y T' : Pı +R* definidos por 


r|] = a+ (a+ b) y rra) = ¿7 


son inversas. 


Solución Calcule 


g le 7 r(r;)) NS la Te al 7 A 


(To Tc + dx) = T(T'(c + dx)) = r|, j i =c+ (c+ (d—c)x=c+ dx 


Por tanto, T'°T = Ip y T ° T' = Ig . En consecuencia, T y T’ son inversas una de la otra. 


a 


Como fue el caso con las matrices invertibles, las inversas de las transformaciones li- 
neales son únicas si existen. El siguiente teorema es el análogo del Teorema 3.6. 


Teorema 6.17 


Si T es una transformación lineal invertible, entonces su inversa es única. 


Demostración La demostración es la misma que la del Teorema 3.6, con productos de 


matrices reemplazadas por composiciones de transformaciones lineales. 
— 


Gracias al Teorema 6.17, si T es invertible, puede referírsele como la inversa de T. Se 
le denotará T”* (pronúnciese “T inversa”). En las dos secciones siguientes se abordará el 
conflicto de determinar cuándo una transformación lineal dada es invertible y encontrar 
su inversa cuando exista. 
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|Hercicios 6.4 


En los ejercicios 1-12, determine si T es una transformación li- 
neal. 


l. 


o 


10. 
11. 
12. 


13. 


14. 


15. 


P NAY 


T: M», —> M, definida por 
4 E f +b 0 | 
d 0 c+d 


w+x 1 | 
0 Y= z 


. T: Muy > M,n definida por T(A) = AB, donde B es una 


matriz fija den X n. 
T: Min > Mn definida por T(A) = AB — BA, donde B 
es una matriz fija de n X n. 
T: Mın —>R definida por T(A) = tr(A) 

R definida por T(A) = apan: 


T : Myn > 
T: Min > R definida por T(A) = rank(A) 


nn 


a 


nn 


. T: P, — P, definida por T (a + bx + cx?) = (a + 1) + 


(b+ 1)x+ (c+ 1)x? 


T: P, >P,definida por Tla + bx + cx?) =a + 
b(x+ 1) + b(x+ 1)? 


T: F — F definida por T(f) = f(x?) 

T: F — F definida por T(f) = (f(x) } 

T: F — R definida por T(f) = f(c), donde c es un es- 
calar fijo 


Demuestre que las transformaciones S y T del ejemplo 
6.56 son lineales. 


Sea T: R? —>R’ una transformación lineal para la cual 
Í 
1 


1 
TE 
3 


ncuentre . 
bl 217 lb 


Sea T : R? —> P, una transformación lineal para la cual 
| 1 

T 
1 


ncuentre . 
9|” [o 


3 2 
=1:=2be y T =x + 2x 


16. 


17. 


18. 


19. 


20. 


21. 
22. 


A 23. 


Sea T: P, — P, una transformación lineal para la cual 
T(1)=1 +x, T(x) =3-—2x y (2) = 4+ 3x 


Encuentre T(4 — x + 3x?) y T(a + bx + cx?). 


Sea T: P, >, una transformación lineal para la cual 
Ti+aA=1+e, Iet) =xa4 xk, 
TQ +x’) =1+xt+x 


Encuentre T(4 — x + 3x°) y T(a + bx + cx?). 


Sea T: My >R una transformación lineal para la cual 


1 T =D, 
0.0 
i | i | 
T =3, T =4 
1 0 1 1 
Ple: i 


Sea T: Ma >R una transformación lineal. Demuestre 
que existen escalares a, b, c y d tales que 


1 


w x 
para todo | | en Ma. 
y z 


3 


1 
Encuentre al 
4 2 


w 


r| = awt istot de 
y z 


Demuestre que no existe transformación lineal 
T : R? —> P, tal que 


2 3 
Tlil=1+x T|0|=2-x+x*, 
0 2 
0 
T| 6|=-2+2x? 
-8 


Demuestre el Teorema 6.14(b). 


Sea [v;,..., v,) una base para un espacio vectorial V y 
sea T: V— V una transformación lineal. Pruebe que si 
T(v,) = vp T(v,) =v,..., T(v,) = Vp entonces T es la 
transformación identidad en V. 


Sea T: P ,—> P, una transformación lineal tal que 
T(x*) = kx*"! para k = 0, 1,...,n. Demuestre que T 
debe ser el operador diferencial D. 
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24. Sean v}, . . . , v, vectores en un espacio vectorial V y sea 

T: V — W una transformación lineal. 

(a) Si [T(v,),..., T(v,)) es linealmente independiente 
en W, demuestre que {v}, . . . , v,) es linealmente in- 
dependiente en V. 

(b) Demuestre que lo contrario del inciso (a) es falso. 
Esto es, no necesariamente es cierto que si 
{Vo .. -> Vp} es linealmente independiente en V, en- 
tonces [T(v,),..., T(v,)) es linealmente indepen- 
diente en W. Ilustre esto con un ejemplo 
T:R >R. 


25. Defina las transformaciones lineales S : R? —> M,, y 


T: R? > R? mediante 
a a+b b c 2c+d 
slo a Y A 


2 
Calcule (S + T) | | y (So T) ll ¿Puede calcular 
y 


X 
(To s| l Si es así, hágalo. 
y 
26. Defina las transformaciones lineales S : P, > P, y 


T: P, > P, mediante 


S(a + bx) = a + (a + b)x + 2bx? 
y T(a + bx + cx?) = b + 2cx 


Calcule (S ° T)(3 + 2x — x°) y (S° T)(a + bx + cx?). 
¿Puede calcular (T ° S)(a + bx)? Si es así, hágalo. 


[55 27. Defina las transformaciones lineales S: P, >, y 
T:P,—>%P,, mediante 
Síp(x)) =p(x+ 1) y TEE) =p'(x) 
Encuentre (S * T)(p(x)) y (T ° Sp(x)). [Sugerencia: 
recuerde la regla de la cadena.] 


| 28. Defina las transformaciones lineales S: P, =>, y 
T:P, > P, mediante 


S(p(x)) =p(x+ 1) y  T(p(x)) =xp'(x) 
Encuentre (S ° T)(p(x)) y (T ° S)(p(x)). 


En los ejercicios 29 y 30, verifique que S y T son inversas. 


4x + 
29. S: R?— R? definida por F = | yr 
y 3x + y 
definida por r|” = | = | 
y —=3x + 4y 


30. S: Y, > P, definida por S(a + bx) = (—4a + b) + 2ax 
y T:P, — P, definida por 


T(a + bx) = b/2 + (a + 2b)x 
3 


32. Sea T: V — V una transformación lineal tal que 
ToT=L1 
(a) Demuestre que {v, T(v)) es linealmente depen- 
diente y sólo si T(v) = +v. 
(b) Ofrezca un ejemplo de tal transformación lineal con 
V= R. 
33. Sea T: V — V una transformación lineal tal que 
TeT=T. 
(a) Demuestre que {v, T(v)} es linealmente depen- 
diente si y solo si T(v) = v o T(v) =0. 
(b) De un ejemplo de tal transformación lineal con 
V =R. 


j< 


. Demuestre el Teorema 6.17. 


El conjunto de todas las transformaciones lineales de un espa- 
cio vectorial V a un espacio vectorial W se denota mediante 
L(V, W). Si S y T están en L(V, W ) puede definirse la suma 
S + TdeS y T mediante 

(S + Div) = S(v) + T(v) 
para todo v en V. Si c es un escalar, se define el múltiplo esca- 
lar cT de T por c como 

(Mv) = cT(v) 

para todo v en V. Entonces S + T y cT son ambas transforma- 
ciones de V a W. 
34. Demuestre que S + T y cT son transformaciones lineales. 


35. Demuestre que £(V, W) es un espacio vectorial con 
esta suma y multiplicación por un escalar. 
36. Sean R, S y T transformaciones lineales tales que las si- 
guientes operaciones tienen sentido. Demuestre que: 
(a) Ro(S+ T) =ReS+RoT 
(b) (Ro S) = (cR) ° S = R o (cS) para cualquier es- 
calar c 


a El kernel y el rango de una transformación lineal 


El espacio nulo y el espacio columna son dos de los subespacios fundamentales asocia- 
dos con una matriz. En esta sección se extienden las nociones al kernel y el rango de una 


transformación lineal. 
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La palabra kernel (núcleo) se de- 
riva de la palabra en inglés antiguo 
cyrnel, una forma de la palabra 
corn, que significa “semilla” o 
“grano”. Como el núcleo del maíz, 
el kernel de una transformación li- 
neal es su “núcleo” o “semilla” en el 
sentido de que aporta información 
acerca de muchas de las propieda- 
des importantes de la transforma- 
ción. 


Definición Sea T: V— W una transformación lineal. El kernel de T, denotado 
ker(T), es el conjunto de todos los vectores en V que se mapean mediante T a 0 en W. 


Esto es, 
ker(T) = [ven V: T(v) = 0) 
El rango de T, denotado rango(T), es el conjunto de todos los vectores en W que son 


imágenes de los vectores en V bajo T. Esto es, 
rango(T) = (T(v) : ven V} 


= [wen W: w = T(v) para algún v en V} 


Sea A una matriz de m X n y sea T = T, la correspondiente transformación matricial de 
R” a R” definida mediante T(v) = Av. Entonces, como se vio en el capítulo 3, el rango 
de T es el espacio columna de A. 

El kernel de T es 


ker(T) = {v en R” : T(v) = 0) 
[ven R” : Av = 0} 
= nulo(A) 


En palabras, el kernel de una transformación matricial es justo el espacio nulo de la ma- 


triz correspondiente. 


> 


Encuentre el kernel y el rango del operador diferencial D : P, —> P, definido por 
D(p(x)) = p'(x). 
Solución Dado que D(a + bx + cx? + dx?) = b + 2cx + 3dx?, se tiene 
ker(D) = {a + bx + cx? + dx? : D(a + bx + cx? + dx?) = 0} 
= {a + bx + cx? + dx?:b + 2cx + 3dx? = 0} 


Pero b + 2cx + 3dx? = 0 si y sólo si b = 2c = 3d = 0, lo cual implica que b = c = d = 0. 
Por tanto, 


ker(D) = {a + bx + cx? + dx? :b = c = d = 0} 
= {a:a en R} 


En otras palabras, el kernel de D es el conjunto de polinomios constantes. 
El rango de D es todo de P, pues todo polinomio en P, es la imagen bajo D (esto es, 
la derivada) de algún polinomio en P,. Para ser específico, si a + bx + cx? está en P,, en- 


tonces 
2 b 2 c 3 
a + bx + cx = D| ax + zje + 3)" 
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Figura 6.7 
b 
Si y = =3 + bx, 


1 
entonces | ydx=0 


0 


Ejemplo 6.61 


Sea S: Pı — R la transformación lineal definida por 
1 
Sp) = | plas 
0 
Encuentre el kernel y el rango de S. 
Solución En detalle, se tiene 


1 
S(a + bx) = | (a + bx) dx 
0 » i 
= ax + J 
2 


=| a+ 0 at 
2 2 


ker(S) = {a + bx: S(a + bx) = 0) 


= fa+tx:a+?=0} 
2 
= dat txia = 2) 
2 
= S-P ox) 
2 


Geométricamente, ker(S) consiste de todos aquellos polinomios lineales cuyas gráficas 
tienen la propiedad de que el área entre la recta y el eje x está igualmente distribuida 
arriba y abajo del eje en el intervalo [0, 1] (vea la figura 6.7). 

El rango de S es R, pues todo número real puede obtenerse como la imagen bajo S de 
algún polinomio en P. Por ejemplo, si a es un número real arbitrario, entonces 


Por tanto, 


1 
faa [ax]¿ =a-0=a 
0 


de modo que a = S(a). 


el 


Ejemplo 6.62 


> 


Sea T : M, > M,, la transformación lineal definida al tomar transpuestas: T(A) = A”. 
Encuentre el kernel y el rango de T. 


Solución Se ve que 
ker(T) = {A en M,,: T(A) = O) 
= {A en M,: A" = O} 
Pero si A? = O, entonces A = (A7 )" = O" = O. Se concluye que ker (T) = {0}. 
En consecuencia, para cualquier matriz A en M,» se tiene A = (A7 )" = T(A?) (yA? 


está en M,,), se deduce que rango(T) = M}, | 


En todos estos ejemplos, el kernel y el rango de una transformación lineal son subes- 
pacios del dominio y el codominio, respectivamente, de la transformación. Dado que se 
generaliza el espacio nulo y el espacio columna de una matriz, acaso esto no sea una sor- 
presa. No obstante, no debe dar nada por sentado, así que es necesario demostrar que no 
es una coincidencia. 
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Teorema 6.18 


Sea T: V — W una transformación lineal. Entonces: 


a. El kernel de T es un subespacio de V. 
b. El rango de T es un subespacio de W. 


Demostración (a) Dado que T (0) = 0, el vector cero de V está en ker(T), de modo que 
ker(T) no está vacío. Sean u y v que están en ker(T) y sea c un escalar. Entonces T (u) = 
T(v) = 0, de modo que 


T(u + v) = T(u) + Tv) =0+0=0 
y T(cu) = cT(u) = c0 = 0 


Por tanto, u + v y cu están en ker(T) y ker(T) es un subespacio de V. 


(b) Puesto que 0 = T(0), el vector cero de W está en rango(T), de modo que rango(T) 
no esta vacío. Sean T (u) y T (v) que están en el rango de T y sea c un escalar. Entonces 
T(u) + T(v) = T(u + v) es la imagen del vector u + v. Dado que u y v están en V, tam- 
bién lo está u + v y por tanto T(u) + T(v) está en rango(T). De manera similar cT(u) = 
T(cu). Dado que u está en V, también lo está cu, y en consecuencia cT(u) está en 
rango(T). Por tanto, rango(T) es un subconjunto no vacío de W que está cerrado bajo la 
suma y la multiplicación por un escalar y por ende, es un subespacio de W. _A 


La figura 6.8 ofrece una representación esquemática del kernel y el rango de una 
transformación lineal. 


rango(T) 


Figura 6.8 
El kernel y el rango de T: V —> W 


En el capítulo 3 se definió el rank de una matriz como la dimensión de su espacio co- 
lumna y la nulidad de una matriz como la dimensión de su espacio nulo. Ahora se ex- 
tienden dichas definiciones a transformaciones lineales. 


Definición Sea T: V> W una transformación lineal. El rank de T es la dimen- 
sión del rango de T y se denota mediante rank(T). La nulidad de T es la dimensión 
del kernel de T y se denota mediante nulidad(T). 


> 
Si A es una matriz y T = T, es la transformación matricial definida por T(v) = Av, en- 
tonces el rango y el kernel de T son el espacio columna y el espacio nulo de A, respecti- 
vamente, por el ejemplo 6.59. En consecuencia, de la sección 3.5, se tiene 


rank(T) = rank(4) y  nulidad(T) = nulidad(A) | 


Sección 6.5 El kernel y el rango de una transformación lineal 503 


> 


Ejemplo 6.64 


Encuentre el rank y la nulidad de la transformación lineal D : P, —> P, definida me- 
diante D(p(x)) = p(x). 
Solución En el ejemplo 6.60 calculó rango (D) = P,, de modo que 

rank(D) = dim Y, = 3 


El kernel de D es el conjunto de todos los polinomios constantes: ker(D) = {a : a en R} 
= fa: 1 : a en R}. Por tanto, {1} es una base para ker(D), de modo que 


> 


nulidad(D) = dim(ker(D)) = 1 


Encuentre el rank y la nulidad de la transformación lineal S : P, — R definida por 


Solución A partir del ejemplo 6.61, rango(S) = R y rank(S) = dim R = 1. Además, 


ker(S) = (+ bx: ben a) 


= {b(—} + x) : ben R} 
= gen(—4 + x) 


de modo que {—} + x} es una base para ker(S). Por tanto, nulidad(S) = dim(ker(S)) = 1. 


m. 


> 


Encuentre el rank y la nulidad de la transformación lineal T : M,, —> M,, definida me- 
diante T(A) = A". 


Solución En el ejemplo 6.62 se encontró que rango(T) = M,, y ker(T) = {O}. Por tanto, 


ps 


En el capítulo 3 se vio que el rank y la nulidad de una matriz A de m X n se relacio- 
nan mediante la fórmula rank(A) + nulidad(A) = n. Este es el Teorema del rank (Teo- 
rema 3.26). Dado que la transformación matricial T = T, tiene R” como su dominio, 
podría rescribir la relación como 


rank(T) = dim M,, =4 y nulidad(T) = dim{O} = 0 


rank(A4) + nulidad(A4) = dim R” 


Esta versión del Teorema del rank se extiende de forma muy amigable a transformacio- 
nes lineales en general, como puede ver a partir de los últimos tres ejemplos: 


rank(D) + nulidad(D)= 3 + 1 = 4 = dim P, Ejemplo 6.64 
rank(S) + nulidad(S) = 1 + 1 = 2 = dim Ë, Ejemplo 6.65 
rank(T) + nulidad(T) = 4 + 0 = 4 = dim M,, Ejemplo 6.66 
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Teorema 6.19 


Teorema del rank 


Sea T: V> W una transformación lineal de un espacio vectorial de dimensión finita 
V a un espacio vectorial W. Entonces 


rank(T) + nulidad(T) = dim V 


En la siguiente sección verá cómo adaptar la demostración del Teorema 3.26 para 
probar esta versión del resultado. Por ahora, se ofrece una demostración alternativa que 
no usa matrices. 


Demostración Sean dim V = n y [v,,..., v,) una base para ker(T) [de modo que nu- 
lidad(T) = dim(ker(T)) = k]. Puesto que {v}, . . . , v,) es un conjunto linealmente in- 
dependiente, puede extenderse a una base para V, por el Teorema 6.28. Sea B = ([v,,..., 
Vo Vir +--> V,) tal base. Si puede demostrar que el conjunto C = (T(vw,,,),..., T(v,)) 
es una base para rango(T), entonces se tendrá rank(T) = dim(rango(T)) = n — k y por 
tanto 


rank(T) + nulidad(T) = k + (n — k) = n = dim V 


como se requiere. 

Ciertamente, C está contenido en el rango de T. Para demostrar que C genera el 
rango de T, sea T (v) un vector en el rango de T. Entonces v está en V, y dado que B es 
una base para V, es posible encontrar escalares c}, . . ., c, tales que 


V S= OV Eo CV E Cri Vr Fi E Cv 
Puesto que v}, . . . , v, están en el kernel de T, se tiene T(v,) = = = T(v,) = 0, de modo 
que 
T(v) = Thav, +0 + Cv E Chhika H E C Wa) 
T(V) +e + Tve) + cki TVer) Hee Tv) 
= 011 Viia) F E Hr.) 


Esto demuestra que C genera el rango de T. 
Para demostrar que C es linealmente independiente, suponga que existen escalares 
Cipp ++ +3 C, tales que 


Cki T(Vk+1) qee Cn 1 (v,,) =0 


Entonces T(Cy4+1Vw+1 t + c,v,) = 0, lo cual significa que C¿41Vp41 +": + cV, está en 
el kernel de T y, en consecuencia, puede expresarse como una combinación lineal de los 
vectores base v, . . . , v, de ker(T), por decir, 


GWV TE CV = CV] +“: + Cova 
Pero ahora va Fa E E O A T0 


y la independencia lineal de B fuerza c, =+: = c, = 0. En particular, c}; =""*=c,=0, 
lo cual significa que C es linealmente independiente. 

Se demostró que C es una base para el rango de T, de modo que, por los comentarios 
anteriores, la demostración está completa. —— A 


Se verificó el Teorema del rank para los ejemplos 6.64, 6.65 y 6.66. En la práctica, este 
teorema permite encontrar el rank y la nulidad de una transformación lineal sólo con la 
mitad del trabajo. Los siguientes ejemplos ilustran el proceso. 
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| mm 


Ejemplo 6.67 Encuentre el rank y la nulidad de la transformación lineal T : P, > P, definida me- 
diante T(p(x)) = xp(x). (Compruebe que T realmente es lineal.) 


»— 
Solución En detalle, se tiene 
T(a + bx + cx?) = ax + bx? + cx? 
Se tiene que 
ker(T) = {a + bx + cx?: T(a + bx + cx?) = 0) 
= {a + bx + cx?:ax + bx? + cx? = 0) 
= {a + bx+cx2:a=b=c=0) 
= {0} 
de modo que se tiene nulidad(T) = dim(ker(T)) = 0. El Teorema del rank implica que 
rank(T) = dim P, — nulidad(T) = 3 — 0 = 3 
Comentario En el ejemplo 6.67 sería igualmente sencillo encontrar primero el rank 
de T, pues {x, x, 1%) es fácilmente vista como una base para el rango de T. Sin embargo, 
por lo general, uno de los dos (el rank o la nulidad de una transformación lineal) sería 
más sencillo de calcular; entonces puede usar el Teorema del rank para encontrar el otro. 
Con práctica, mejorará para saber por cuál camino avanzar. 
| > 
Ejemplo 6.68 Sea W el espacio vectorial de todas las matrices simétricas de 2 X 2. Defina una trans- 


formación lineal T : W— P, mediante 


aja a) + (B= ox + (e= a) 


M=>= (Compruebe que T es lineal.) Encuentre el rank y la nulidad de T. 


Solución La nulidad de T es más fácil de calcular directamente que el rank, así que se 
procede del modo siguiente: 


T 1 
L f 
S] 
~ 
© a 
na > 
uu 
Il 
== 


ker(T) = f 


J 
OS 
a 
| 
ey 
=— 
+ 
PS 
Ss 
| 
a) 
— 
R 
+ 
A 
a 
| 
a 
— 
al 
N 
II 
o 
=— 


r 
SJ 


a a TASAS» cos 


A SA Sa > a 


-l 
. 
+ (e J= 
E) 


1 1 
Por tanto, l | i a } es una base para el kernel de T, de modo que nulidad(T) = dim 


r 
5 ey 
e 


(ker(T)) = 1. El Teorema del rank y el ejemplo 6.42 dicen que rank(T) = dim W — nu- 


lidad(T) = 3 —- 1 = 2. | 
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Transformaciones lineales inyectivas y sobreyectivas 


Ahora se investigarán criterios para que una transformación lineal sea invertible. Las cla- 
ves para la discusión son las muy importantes propiedades inyectivas y sobreyectivas. 


Definición Una transformación lineal T: V—> W se llama inyectiva si T mapea 
distintos vectores en V a distintos vectores en W. Si rango(T) = W, entonces T se 
llama sobreyectiva. 


Comentarios 
e La definición de inyectiva puede escribirse de manera más formal del modo si- 
guiente: 


T: V— W es inyectiva si, para todos u y v en V, 


u Æ v implica que T(u) 4 T(v) 


El enunciado anterior es equivalente al siguiente: 


T: V— W es inyectiva si, para todos u y v en V, 


T(u) = (v) implica que u = v 


La figura 6.9 ilustra estos dos enunciados. 


VA 


V W V W 
(a) T es inyectiva (b) T no es inyectiva 


e Otra forma de escribir la definición de sobreyectiva es la siguiente: 


T: V> W es sobreyectiva si, para todo w en W, existe al menos un v en V tal que 


w = T(v) 


En otras palabras, dado w en W, ¿existe algún v en V tal que w = T'(v)? Si, para un w ar- 
bitrario, puede resolver esta ecuación para v, entonces T es sobreyectiva (vea la figura 
6.10). 
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T. T 
\ i 
rango(T) rango(T) 
>o >o 
V W V W 


(a) T es sobreyectiva (b) T no es sobreyectiva 


Figura 6.10 


¿Cuál de las siguientes transformaciones lineales son inyectivas? ¿y sobreyectivas? 
2x 
(a) T: R?> R? definida mediante al =|x-—y 
4 0 
(b) D: P, — P, definida mediante D(p(x)) = p' (x) 
(c) T: M,, > M, definida mediante T(A) = A? 


> Xx; Xx) 
Solución (a) Sea T =T . Entonces 
yı Ya 


2x 2x 
ATY|=-]|%7 Y 
0 0 


de modo que 2x, = 2x, Y Xx, — y, = Xx, — y, Al resolver estas ecuaciones se ve que x, = 


X2 


| y en consecuencia T es inyectiva. 
Ya 


— Xx; 
X, y Y, = y,- Por tanto, , = 
1 


T no es sobreyectiva, pues su rango no es todo R?, Para ser específicos, no hay vector 


0 
la en R° tal que 1] = | 0 |. (¿Por qué no?) 
y y 1 


(b) En el ejemplo 6.60 se demostró que rango(D) = P,, de modo que D es sobreyectiva. 
D no es inyectiva pues distintos polinomios en P, pueden tener la misma derivada. Por 
ejemplo, x? 4 x? + 1, pero D(x7) = 3x? = D(æ + 1). 

(c) Sean A y B en M,» con T(A) = T(B). Entonces A” = B", de modo que A = (4?) = 
(B" y” = B. En consecuencia, T es inyectiva. En el ejemplo 6.62 se demostró que 
rango(T) = M, Por tanto, T es sobreyectiva. A 


Es evidente que existe un criterio muy simple para determinar si una transformación 
lineal es inyectiva. 


Teorema 6.20 


Una transformación lineal T : V —> W es inyectiva si y sólo si ker(T) = {0}. 
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Demostración Suponga que T es inyectiva. Si v está en el kernel de T, entonces T (v) = 0. 
Pero también se sabe que T (0) = 0, de modo que T (v) = T (0). Puesto que T es inyectiva, 
esto implica que v = 0, de modo que el único vector en el kernel de T es el vector cero. 
Por el contrario, suponga que ker(T) = {0}. Para demostrar que T es inyectiva, sean 
u y v que están en V, con T (u) = T(v). Entonces T(u — v) = T (u) — T(v) = 0, lo que 
implica que u — v está en el kernel de T. Pero ker (T) = {0}, de modo que debe tener 

u — v = 0 o, de manera equivalente, u = v. Esto demuestra que T es inyectiva. 
| => 
> 


Ejemplo 6.70 


Demuestre que la transformación lineal T : R? —> P, definida mediante 


00 = a + (a+ b) 


es inyectiva y sobreyectiva. 
z pa š 
Solución Si H está en el kernel de T, entonces 


a 


0=T 
$ 


| =a + (a + b)x 
i pa 0 
Se tiene que a = 0 y a + b = 0. Por tanto, b = 0 y en consecuencia H = ol Así que, 


0 
ker(T) = l H » y T es inyectiva por el Teorema 6.20. 
Por el Teorema del rank, 
rank(T) = dim R? — nulidad(T) = 2 — 0 = 2 


Por tanto, el rango de T es un subespacio bidimensional de R? y en consecuencia 
rango(T) = R?. Se tiene que T es sobreyectiva. | 


Para transformaciones lineales entre dos espacios vectoriales n-dimensionales, las 
propiedades de inyectivas y sobreyectivas están estrechamente relacionadas. Observe 
primero que para una transformación lineal T : V— W, ker(T') = {0} si y sólo si nuli- 

>  dad(T) = 0, y Tes sobreyectiva si y sólo si rank(T) = dim W. (¿Por qué?) La demostra- 
ción del siguiente teorema en esencia usa el método del ejemplo 6.70. 


Teorema 6.21 


Sea dim V = dim W = n. Entonces una transformación lineal T: V—> W es inyectiva 
si y sólo si es sobreyectiva. 


Demostración Suponga que T es inyectiva. Entonces nulidad(T) = 0 por el Teorema 
6.20 y la observación anterior al teorema 6.21. El Teorema del rank implica que 


rank(T) = dim V — nulidad(T) =n — 0 = n 


Por tanto, T es sobreyectiva. 
Por el contrario, suponga que T es sobreyectiva. Entonces rank(T) = dim W = n. 
Por el Teorema del rank, 


nulidad(T) = dim V — rank(T) =n=n=0 


En consecuencia, ker(T) = {0} y T es inyectiva. 
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En la sección 6.4 se apuntó que si T : V —> W es una transformación lineal, entonces 
la imagen de una base para V bajo T no necesita ser una base para el rango de T. Ahora 
es posible dar una condición que garantice que una base para V se mapeará mediante T 
a una base para W. 


Teorema 6.22 


Sea T: V —> W una transformación lineal inyectiva. Si S = [v,,..., v,) es un conjunto 
linealmente independiente en V, entonces T(S) = {T(v;), ..., T(v,)) es un con- 
junto linealmente independiente en W. 


Demostración Sean c,,...,c, escalares tales que 
c¡T(v,) AS E CI (v;) =0 


Entonces T (cv; +++ cv) = 0, lo que implica que c,v, +: +++ c¿v, está en el kernel de 
T. Pero, dado que T es inyectiva, ker (T) = {0}, por el Teorema 6.20. En consecuencia, 


C1V1 Ad CKVk = 0 


Pero, puesto que dim {v}, . . . , v;). es linealmente independiente, todos los escalares c; 
deben ser 0. Por tanto, {T (v;), ..., T(v,)) es linealmente independiente. = 


Corolario 6.23 


Sea dim V = dim W = n. Entonces una transformación lineal inyectiva T : V —> W 
mapea una base para V a una base para W. 


Demostración Sea B = {v;,...,V,} una base para V. Por el Teorema 6.22, T(B) = 
[T(w,), ..., T(v,)) es un conjunto linealmente independiente en W, así que sólo es ne- 
cesario demostrar que T(15) genera a W. Pero, por el Teorema 6.15, T(B) genera el rango 
de T. Más aún, T es sobreyectiva, por el Teorema 6.21, de modo que rango(T) = W. Por 
tanto, T(B) genera a W, lo que completa la demostración. E 


Ejemplo 6.71 


> 
Sea T: R? —> P; una transformación lineal del ejemplo 6.70, definida mediante 


00 = a+ (a+ b) 


Entonces, por el corolario 6.23, la base estándar E = {e}, e,) para R? se mapea a una base 
T(€) = [T(e,), T(e,)) de P,. Se descubre que 


T(e,) = ASES y Te) = 11) => 


Se concluye que {1 + x, x} es una base para P.. | 


Ahora puede determinar cuáles transformaciones lineales T: V—> W son invertibles. 


Teorema 6.24 


Una transformación lineal T : V—> W es invertible si y sólo si es inyectiva y sobreyec- 
tiva. 
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Demostración Suponga que T es invertible. Entonces existe una transformación lineal 
T~! : W > V tal que 


T'S T= Iy y TST = Te 


Para demostrar que T es inyectiva, sea v que está en el kernel de T. Entonces, T (v) = 0. 
Por tanto, 


T (T(v)) = T (0) = (T° T)(v)=0 
=> I(v)=0 


>v=0 
que establece que ker(T) = {0}. En consecuencia, T es inyectiva por el Teorema 6.20. 


Para demostrar que T es sobreyectiva, sea w que está en Wy sea v = T~! (w). Enton- 
ces 


T(v) = T(T"(w)) 


lo que demuestra que w es la imagen de v bajo T. Puesto que v está en V, esto demuestra 
que T es sobreyectiva. 

Por el contrario, suponga que T es inyectiva y sobreyectiva. Esto significa que nuli- 
dad(T) = 0 y rank(T) = dim W. Es necesario demostrar que existe una transformación 
lineal T’ : W—> V tal que T">T=I,yT>eT' = Iw- 

Sea w que está en W. Dado que T es sobreyectiva, existe algún vector v en V tal que 
T(v) = w. Sólo existe uno de tales vectores v, pues, si v' es otro vector en V tal que T(v”) 
= w, entonces T(v) = T(v'); el hecho de que T sea inyectiva implica entonces que v = 
v'. En consecuencia, tiene sentido definir un mapeo T' : W—> V al establecer T'(w) = v. 

Se tiene que 


(T' ° T)(v¥) = T'(T(v)) = T'(w) =v 
y (T° T')(w) = T(T'(w)) = T~) =w 


Entonces se tiene que T' ° T = Iy y T° T' = Iwy. Ahora debe demostrar que T’ es una 
transformación lineal. 

Para este fin, sean w, y w, que están en W y sean c; y C, escalares. Como anterior- 
mente, sean T(v,) = w, y T(v,) = w,. Entonces v, = T'(w,) y v, = T'(w,) y 


T'(aw, + ow) = T'(c,T(v,) + c,T(v,)) 
T'(T(cv, + c,v2)) 


= I(c¡v, + ov) 


Civ] + OV 


c¡T'(w,) + c,T'(w)) 


En consecuencia, T” es lineal y, por el Teorema 6.17, T' = pol, — 
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isomorfismos de espacios vectoriales 


Las palabras isomorfismo e isomór- 
fico provienen de las palabras gie- Ahora está en posibilidad de describir, en términos concretos, qué significa que dos es- 
gas isos, que significa “igual”, y pacios vectoriales sean “esencialmente iguales”. 

morph, que significa “formar”. Por 
tanto, en sentido figurado, los es- 
pacios vectoriales isomórficos 
tienen “formas iguales”. 


Definición Una transformación lineal T : V> W se llama isomorfismo si es in- 
yectiva y sobreyectiva. Si V y W son dos espacios vectoriales tales que existe un iso- 
morfismo de V a W, entonces se dice que V es isomórfica a W y se escribe V = W. 


Ejemplo 6.72 


Demuestre que P,- y R” son isomórficas. 


Solución El proceso de formar el vector coordenado de un polinomio proporciona un 
posible isomorfismo (como ya se observó en la sección 6.2, aunque ahí no se usó el tér- 
mino isomorfismo). Específicamente, defina T : WP,_, —> R” mediante T(p(x)) = [p(x) Je, 
donde € = [1,x,...,x"] es la base estándar para P,,_,. Esto es, 


El Teorema 6.6 muestra que T es una transformación lineal. Si p(x) = a, + ax +: + 


a,x"! está en el kernel de T, entonces 


ao 0 
| | = Tla + ax +e + aix") = 
å; 0 
Por ende, a, = a, =+ = a,- = 0, de modo que p(x) = 0. En consecuencia, ker(T) = 


{0} y T es inyectiva. Puesto que dim Y, , = dim R” = n, T también es sobreyectiva, por 
el Teorema 6.21. Por tanto, T es un isomorfismo y P,- = R”. 


Ejemplo 6.73 Demuestre que M 


mr 


, y R"” son isomórficos. 


Solución Una vez más, el mapeo coordenado desde M,,,, hacia R”” (como en el ejem- 


mn 


plo 6.36) es un isomorfismo. Los detalles de la demostración se dejan como ejercicio. 


sl 


De hecho, la forma más sencilla de decir si dos espacios vectoriales son isomórficos 
es simplemente verificar sus dimensiones, como muestra el siguiente teorema. 
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Teorema 6.25 Sean Vy W dos espacios vectoriales de dimensión finita (sobre el mismo campo de 
escalares). Entonces V es isomórfico a W si y sólo si dim V = dim W. 


Demostración Sean = dim V. Si V es isomórfico a W, entonces existe un isomorfismo 
T: V—> W. Dado que T es inyectiva, nulidad(T) = 0. Entonces el Teorema del rank im- 
plica que 


rank(T) = dim V — nulidad(T) = n — 0 = n 


Por tanto, el rango de T es un subespacio n-dimensional de W. Pero, puesto que T es so- 
breyectiva, W = rango(T), así que dim W = n, como se quería demostrar. 

Por el contrario, suponga que V y W tienen la misma dimensión, n. Sea B = {v1,..., 

v, ) una base para V y sea C = [w,,..., w,) una base para W. Se definirá una transfor- 

mación lineal T : V —> W y entonces se demostrará que T es inyectiva y sobreyectiva. Un 

vector arbitrario v en V puede escribirse de manera única como una combinación lineal 
de los vectores en la base $, por decir, 

v= CV ++ Cv, 


Se define T mediante 


T(v) = aw, ++: + cw, 


nn 


»—> Es directo comprobar que T es lineal. (Hágalo.) Para ver que T es inyectiva, suponga 
que v está en el kernel de T. Entonces 


Cc W, ++: + cw, = T(v) =0 
y la independencia lineal de C fuerza c, =***= c„ = 0. Pero entonces 


V=CV +0 +cv,=0 


de modo que ker(T) = {0}, lo que significa que T es inyectiva. Puesto que dim V = dim W, 
T también es sobreyectiva, por el Teorema 6.21. Por tanto, T es un isomorfismo y 
V =Ww. — 


Solución Dado que dim R” = n + n + 1 = dim P,, R” y 4, no son isomórficos, por 
el Teorema 6.25. 


| > 
Ejemplo 6.75 Sea W el espacio vectorial de todas las matrices simétricas de 2 X 2. Demuestre que W es 
isomórfico a R’. 


Ejemplo 6.74 | Demuestre que R” y P, no son isomórficos. 


Solución En el ejemplo 6.42 se demostró que W = 3. Por tanto, dim W = dim R, de 
modo que W = R?, por el Teorema 6.25. (Existe un obvio candidato para un isomor- 
»—>  fismo T: W—> R°. ¿Cuál es?) ' 
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Comentario Todos los ejemplos han sido espacios vectoriales reales, pero los teore- 
mas que se demostraron son verdaderos para espacios vectoriales sobre los números 
complejos C o Z,, donde p es primo. Por ejemplo, el espacio vectorial M,,(Z,) de todas 
las matrices de 2 X 2 con entradas de Z, tiene dimensión 4 como espacio vectorial sobre 
Z, y por tanto M,,(Z,,) = Z$. 


Í Ejercicios 6.5 
Y 


z= 
1. Sea T: M,, > M, la transformación lineal definida por (a) ¿Cuáles, si hay alguno, de los siguientes polinomios 
b están en ker(T)? 
al [- f el 02 MX (ii 1-x 
c d 0 d (b) ¿Cuáles, si hay alguno, de los polinomios del inciso 
(a) ¿Cuáles, si hay alguna, de las siguientes matrices (a) están en rango(T)? 
están en ker(T)? (c) Describa ker(T) y rango(T). 
(i) | : 2] (ii) E H (iii) f 4 En los ejercicios 5-8, encuentre bases para el kernel y el rango 
=1 3 2 0 0 =3 de la transformación lineal T en los ejercicios indicados. En 
(b) ¿Cuáles, si hay alguna, de las matrices en el inciso cada caso, establezca la nulidad y el rank de T y verifique el 
(a) están en rango(T)? Teorema del rank. 
(c) Describa ker(T) y rango(T). 5. Ejercicio 1 6. Ejercicio 2 
2. Sea T: M >R definida por T(A) = tr(A). 7. Ejercicio 3 8. Ejercicio 4 


(a) ¿Cuáles, si hay alguna, de las siguientes matrices 
están en ker(T)? 


0 5 -1 2 En los ejercicios 9-14, encuentre o la nulidad o el rank de T y 
(i) | i al (ii) h i | (iii) | 0 | luego use el Teorema del rank para encontrar el otro. 


1 


9. T: Ma —> R definida mediante aa a = k 6 4 
(b) ¿Cuáles, si hay alguno, de los siguientes escalares c d c=d 
están en rango(T)? p(0) 
(10 (ii) 5 Gii) —- V2 10. T: P, — R definida mediante T(p(x)) = E al 


(c) Describa ker(T) y rango(T). 


AS , 11. T: M,, —> M» definida mediante T(A) = AB, donde 
3. Sea T: P, >R? la transformación lineal definida por 


L =1 
a=b B= E | 
T(a + bx + cx?) = 
bte 12. T: M >M», definida mediante T(A) = AB — BA, 
(a) ¿Cuáles, si hay alguno, de los siguientes polinomios 1 —1 
están en ker(T)? donde B = 1 
(i) 1+x Gi) x — x? (iii) 1 + x — x? i , , 
(b) ¿Cuáles, si hay alguno, de los siguientes vectores L 13. T: P, >R definida mediante T(p(x)) = p'(0) 
están en rango(T)? 14. T: Mz; —> Mz; definida mediante T(A) = A — A" 
10 ss Jal iy |0 
(i) 0 (ii) 0 (iii) 1 En los ejercicios 15-20, determine si la transformación lineal T 
(c) Describa ker(T) y rango(T). es (a) inyectiva y (b) sobreyectiva. 
[E 4. Sea T:P,> Pa la transformación lineal definida por 15. T : R? — R? definida mediante r|” — ls a y] 
T(p(x)) = xp'(x). y) leta 
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16. 


17. 


18. 


19. 


20. 
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T : P, > M, definida mediante 


a+b 
2a+c 


a+ 2c 


T(a + bx + cx?) = p 
=g 


T: P, — R’? definida mediante 


2a=b 
Tla+bx+cx?) =|a+b= 3c 
c~a 


T: P ,— R? definida mediante T(p(x)) 


II 
m~a 
>> 
AS 

Ra. oO 
Y N 
LL 


T : R?*> M,, definida mediante 
a 
a=b b-c 
T| b| = 
l +b b+ c] 
ĉ 
a 
T : R? — W definida mediante T| b | = 
č 
+b+ - 
Ñ A a donde W es el espacio vectorial 
b=2c a=c 


de todas las matrices simétricas de 2 X 2 


En los ejercicios 21-26, determine si V y W son isomórficos. Si 
lo son, ofrezca un isomorfismo T : V —> W explícito. 


21. 
22 


23. 


29. 


30. 


V = D, (matrices diagonales de 3 X 3), W = R? 


. V = S, (matrices simétricas de 3 X 3), W = U, (matri- 


ces triangulares superiores de 3 X 3) 


V = S, (matrices simétricas de 3 X 3), W = S3 (matri- 
ces antisimétricas de 3 X 3). 


. V = P., W = {p(x) en P, : p(0) = 0} 
.V=C,W=R 

. V = {A en Mz: tr(A) = 0), W = R? 

. Demuestre que T: P ,—> P, definida mediante T(p(x) ) 


= p(x) + p'(x) es un isomorfismo. 


. Demuestre que T: P ,— P, definida mediante T(p(x)) 


= p(x — 2) es un isomorfismo. 


Demuestre que T: P, — P, definida mediante 
1 
T(p(x)) = vp() es un isomorfismo. 


(a) Demuestre que 6 [0, 1] = € [2, 3]. [Sugerencia: de- 
fina T:6[0, 1] >“€[2, 3] al hacer T(f) la función 
cuyo valor en x es (T(f))(x) = f(x — 2) para x en 
[2,314] 


31. 
32. 


33. 


34. 


36. 


37. 


38. 


(b) Demuestre que € [0, 1] = €[a, a + 1] para toda a. 
Demuestre que 6[0, 1] = €[o, 2]. 


Demuestre que €[ a, b] ='€[c, d] para toda a < b y 
c<d. 


Sean S: V> W y T: U—> V transformaciones lineales. 

(a) Demuestre que si S y T son ambas inyectivas, tam- 
bién lo es S o T. 

(b) Demuestre que si S y T son ambas sobreyectivas, 
también lo es S ° T. 


Sean S: V> W y T: U—> V transformaciones lineales. 

(a) Demuestre que si S ° T es inyectiva, también lo es T. 

(b) Demuestre que si S ° T es sobreyectiva, también lo 
es S. 


. Sea T: V—> W una transformación lineal entre dos es- 


pacios vectoriales de dimensión finita. 

(a) Demuestre que si dim V < dim W, entonces T no 
puede ser sobreyectiva. 

(b) Demuestre que si dim V > dim W, entonces T no 
puede ser inyectiva. 


Sean Ap, 41, ..., Ap Nn + 1 números reales distintos. De- 
fina T: P, —|R"*!* mediante 


p(a,) 


Demuestre que T es un isomorfismo. 


Si V es un espacio vectorial de dimensión finita y T : V 
> V es una transformación lineal tal que rank(T) = 
rank( T°), Demuestre que rango(T)N ker(T) = {0}. [Su- 
gerencia: T? denota T ° T. Use el Teorema del rank para 
ayudar a demostrar que los kerneles de T y T’ son igua- 
les. ] 


Sean U y W subespacios de un espacio vectorial V de di- 

mensión finita. Defina T : U X W —> V mediante T(u, 

W)=u-—w. 

(a) Demuestre que T es una transformación lineal. 

(b) Demuestre que rango(T) = U + W. 

(c) Demuestre que ker(T) = U N W. [Sugerencia: vea el 
ejercicio 50 de la sección 6.1.] 

(d) Demuestre la identidad de Grassmann: 


dim(U + W) = dimU + dimW — dim(U N W) 


[Sugerencia: aplique el Teorema del rank y use los resultados 
de (a) y (b) y el ejercicio 43(b) de la sección 6.2.] 
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La matriz de una transformación lineal 


El Teorema 6.15 demostró que una transformación lineal T : V —> W está completa- 
mente determinada por su efecto sobre un conjunto generador para V. En particular, si 
se sabe cómo actúa T sobre una base para V, entonces es posible calcular T (v) para cual- 
quier vector v en V. El ejemplo 6.55 ilustró el proceso. En el Teorema 3.31 se usó de ma- 
nera implícita esta importante propiedad de las transformaciones lineales para ayudar a 
calcular la matriz estándar de una transformación lineal T : R” —> R”. En esta sección se 
demostrará que toda transformación lineal entre espacios vectoriales de dimensión fi- 
nita puede representarse como una transformación matricial. 

Suponga que V es un espacio vectorial n-dimensional, W es un espacio vectorial m- 
dimensional y T: V—> W es una transformación lineal. Sean B y C bases para V y W, res- 
pectivamente. Entonces el vector coordenado que mapea R(v) = [v]» define un iso- 
morfismo R : V— R”. Al mismo tiempo, se tiene un isomorfismo S: W —> R” dado por 
S(w) = [w]¿, que permite asociar la imagen T(v) con el vector [T(v)]¿ en R”. La figura 
6.11 ilustra las relaciones. 


o " M Tv) Y 
e. —— ~ p e 
R`! R S 
R” R” 
A 
[vlgs ° T° R! [Tle 


Figura 6.11 


Dado que R es un isomorfismo, es invertible, de modo que puede formarse el mapeo 
compuesto 


So To R: R"—>R” 


que mapea [v] a [T(v)]¿. Puesto que este mapeo va de R” a R”, se sabe del capí- 
tulo 3 que es una transformación matricial. Entonces, ¿cuál es la matriz estándar de 
SoToR”*? Se quiere encontrar la matriz A de m X n tal que A[v] = (S + T ° R™')([v]ṣ). 
O, puesto que (S ° T o R™')([v]g) = [T(v)]¿, se requiere 


Alv]s = [T(Wle 


Es evidente que es sorprendentemente fácil de encontrar. La idea básica es la del Teorema 
3.31. Las columnas de A son las imágenes de los vectores base estándar para R” bajo S ° 


ToR”?, Pero, si B = [v;,..., v,) es una base para V, entonces 
R(v;) = [ve 
0 
=| 1 <— i-ésima entrada 
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de modo que R™!(e;) = v,. Por tanto, la i-ésima columna de la matriz A que se busca está 
dada por 


que es el vector coordenado de T'(v;) con respecto a la base C de W. 
Este análisis se resume como teorema. 


Teorema 6.26 Sean V y W dos espacios vectoriales con dimensión finita con bases B y C, respectiva- 
mente, donde B = fv,,...,v,). Si T: V— W es una transformación lineal, entonces 
la matriz A de m X n definida por 


A= [[T(v1)le | [T(va)Je +++ [T(v,)1c] 


satisface 


Alv]s = [T(w)le 
para todo vector v en V. 


La matriz A en el Teorema 6.26 se llama matriz de T con respecto a las bases B y C. A 
continuación se ilustra la relación. (Recuerde que T, denota multiplicación por A.) 


v => T(v) 


y y 


[vla —> Alv]s = [T(M le 


Comentarios 

e La matriz de una transformación lineal T con respecto a las bases B y C en oca- 
siones se denota mediante [T]¿._g. Note la dirección de la flecha: derecha a izquierda 
(no izquierda a derecha, como para T: V—> W). Con esta notación, la ecuación final en 
el Teorema 6.26 se convierte en 


[Tlecslv]s = [T(v)Je 


Observe que las $ en los subíndices aparecen lado a lado y parecen “cancelarse” mutua- 
mente. Con palabras, esta ecuación dice: “la matriz para T multiplicado por el vector co- 
ordenado para v produce el vector coordenado para T (v)? 

En el caso especial donde V = Wy B = C, se escribe [T]y (en lugar de [ T]geg). En- 
tonces el Teorema 6.26 establece que 


+ La matriz de una transformación lineal con respecto a las bases dadas es única. 
Esto es, para todo vector v en V, existe solamente una matriz A con la propiedad especi- 
ficada por el Teorema 6.26, a saber, 


(En el ejercicio 39 se le pide probar esto.) 
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+ El diagrama que sigue al Teorema 6.26 en ocasiones se conoce como diagrama 
conmutativo porque puede iniciar en la esquina superior izquierda con el vector v y lle- 
gar a [T(v)]¿ en la esquina inferior derecha en dos formas diferentes, pero equivalentes. 
Si, como antes, los mapeos coordenados que mapean v a [v] y w a [w]¿ se denotan R y 
S, respectivamente, entonces esta “conmutatividad” puede resumirse como 


SoT=T,oR 


La razón para el término conmutativo se vuelve más clara cuando V = Wy B = C, por- 
que entonces R = S también, y se tiene 


RoT=T,eR 


lo que sugiere que el mapeo coordenado R conmuta con la transformación lineal T 
(siempre que se use la versión matricial de T, a saber T4 = Tir, donde se requiere). 

+ La matriz [T]¿._g¿ depende del orden de los vectores en las bases B y C. Al reor- 
denar los vectores dentro de cualquiera de las bases afectará la matriz [Tlc.-g. [Vea el 
ejemplo 6.77(b).] 


Ejemplo 6.76 


Sea T : R? — R? la transformación lineal definida por 


=2 

xX 
xEY=3z 

Z 


y sean B = {e;, €, e3} y C = [e,, e,) bases para R? y R?, respectivamente. Encuentre la 
1 


matriz de T con respecto a B y C y verifique el Teorema 6.26 parav =| 3|. 
=2 


Solución Primero calcule 


10) =|]. Te) = |, res] 


A continuación se necesitan sus vectores coordenados con respecto a C. Dado que 


1 =2 0 
ete | i | 0.20, |5] = -3e + 0e, 


se tiene 


| [Tede =| h (Tele = 8] 


Por tanto, la matriz de T con respecto a B y C es 


[Tel =| 


A = [T]ecg = [[Tle1)le [T(e2)]e [T(e3)1c] 
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»—> 


Para verificar el Teorema 6.26 para v, calcule primero 


Entonces [via =| 3 


| mor), 


(Compruebe esto.) 
Al usar todos estos hechos, se confirma que 


av=, ! F E =| 2] = cre 


Ejemplo 6.71 


> 


Sea D : P, >, el operador diferencial D(p(x)) = p'(x). Sean B = {1, x, x°, x°} y C = 


[L, x, x?) bases para P, y P,, respectivamente. 


(a) Encuentre la matriz A de D con respecto a B y C. 


(b) Encuentre la matriz A' de D con respecto a B' y C, donde B’ = fx 3, x?, x, 1). 
P y 


(c) Con el inciso (a), calcule D(5 — x + 2x7) y D(a + bx + cx? + dx?) para verificar el 
y P 


Teorema 6.26. 


Solución Note primero que D(a + bx + cx? + dx?) = b + 2cx + 3dx”. (Vea el ejemplo 


6.60.) 


(a) Dado que las imágenes de la base B bajo D son D(1) = 0, D(x) = 1, D(x?) = 2x y 


D(x?) = 3x?, sus vectores coordenados con respeto a C son 
0 0 


1 
[D(Dle=|0|, [D(*)Je=|0|, Peah DP) = 
0 


0 


En consecuencia, 


A = [Dlees = [[D(Dle | [DG | [DES de | 1065310] 


0 


01.00 
=|0 0 2 0 
0 0 0 3 


(b) Puesto que la base B' es justo B en el orden inverso, se ve que 


A' = [Dlecó = [[D(4) Je | [DGA e | [DO de | [PO] 


0 0 0 
0 2 0 
3 0 0 


O O =. 


0 
0 
3 
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(Esto demuestra que el orden de los vectores en las bases B y C afecta la matriz de una 
transformación con respecto a dichas bases.) 


(c) Primero calcule directamente D(5 — x + 2x°) = —1 + 6x? y obtenga el vector co- 
ordenado 
-1 
[D(5 — x + 2x°)]e =[-1 + 6x*le =| 0 
6 
Por otra parte, 
5 
=z ke] 
0 
2 
de modo que 
0.100 A =] 
A55=x+2x*g=|0 0 2 0 F =| 0|=[D(5-—x+ 2%) le 
0 0 0 3 5 6 


lo que concuerda con el Teorema 6.26. La demostración del caso general se deja como 


ejercicio. 


Dado que la transformación lineal en el ejemplo 6.77 es fácil de usar directamente, 
en realidad no hay ventaja al usar la matriz de esta transformación para hacer los 
cálculos. Sin embargo, en otros ejemplos, especialmente los laboriosos, el esquema ma- 
tricial puede ser más simple, pues es muy adecuado para su implementación en compu- 
tadora. El ejemplo 6.78 ilustra la idea básica detrás de este enfoque indirecto. 


Ejemplo 6.78 Sea T: P, > P, la transformación lineal definida por 
T(p(x)) = p(Qx — 1) 


(a) Encuentre la matriz de T con respecto a E = {1, x, x°}. 


(b) Calcule T(3 + 2x — x?) indirectamente, use el inciso (a). 


Solución (a) Se ve que 
T(1)=1, T(x)=2x-— 1, T(x?) = (2x-— 1) = 1 — 4x + 4x? 


de modo que los vectores coordenados son 


1 -1 1 
[TA] =] 0h [T] 2p [T] ] -4 
0 0 4 
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(b) El Teorema 6.26 se aplica del modo siguiente: el vector coordenado de p(x) = 3 + 
2x — x° con respecto a € es 


3 
[l=] 2 
=1 
Por tanto, por el Teorema 6.26, 
[T(3 + 2x = x%)]: = [T(po)]: 
= [Tel px) le 
E =l 1 3 0 
=1|0 2 -4 2|= 8 
0 0 4 || —1 —4 


Se concluye que T(3 + 2x — x?) = 0-1 + 8.x — 4+ x° = 8x — 4x?. [Verifique esto al 
calcular directamente T(3 + 2x — x°) = 3 + 2(2x — 1) — (2x — 1)?] | 


La matriz de una transformación lineal a veces puede usarse en formas sorprenden- 
tes. El ejemplo 6.79 muestra su aplicación a un problema de cálculo tradicional. 


D 


Ejemplo 6.79 


p— 


> 


Sea Y el espacio vectorial de todas las funciones derivables. Considere el subespacio W 
de D dado por W = gen(e*, xe*, x?e**). Puesto que el conjunto B = [e*%, xe*, x’e™} es 
linealmente independiente (¿por qué?), es una base para W. 


(a) Demuestre que el operador diferencial D mapea a W en sí mismo. 


(b) Encuentre la matriz de D con respecto a B. 


(c) Calcule indirectamente la derivada de 5e* + 2xe** — x?%e* con el Teorema 6.26 y 


verifíquela usando el inciso (a). 
Solución (a) Al aplicar D a un elemento general de W, se ve que 
D(ae* + bxe* + cx’e™) = (3a + bje* + (3b + 2c)xe™ + 30x?e** 


(compruebe esto), que de nuevo está en W. 
(b) Al usar la fórmula del inciso (a), se ve que 


D(e™) = 3%, D(xe™) = e™ + 3xe™, D(a?te%) = 2xe™ + 3x’°e™ 


de modo que 
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(c) Para f(x) = 5e*% + 2xe* — x?%e**, se ve por inspección que 


5 
fok] 2 
=l 
En consecuencia, por el Teorema 6.26, se tiene 
3 1 0 5 17 
[D(f0))]s = [DIs[£60]s =| 0 3 2 || 2|=| 4 
0 0 3]L-1 =3 


lo que, a su vez, implica que f(x) = D(f(x)) = 17e* + 4xe* — 3x*e*, en concordancia 


con la fórmula del inciso (a). | 


Comentario El punto del ejemplo 6.79 no es que este método sea más sencillo que 
la derivación directa. De hecho, una vez establecida la fórmula en el inciso (a), hay poco 
que hacer. Lo que es significativo es que los métodos matriciales pueden usarse en lo que, 
en la superficie, parece ser un problema de cálculo. Esta idea se explorará aún más en el 
ejemplo 6.83. 


> 


Sea V un espacio vectorial n-dimensional y sea I la transformación identidad en V. ¿Cuál 
es la matriz de I con respecto a las bases B y C de V, si B = C (incluido el orden de los 
vectores base)? ¿Qué pasa si B + C? 


Solución Sea B = (fv,,...,v,). Entonces I(v,) = v,,...,I(v,) = v,, de modo que 


ji 
o 
o 


Mob]: |=eo Utrdle= |: |=e > k S 
0 0 1 
ysiB=C, 
e = (Uv) e Uva] i++ i)e] 
= [e le, Pe | e] 
= I, 


la matriz identidad de n X n. (Esto es lo que esperaba, ¿o no?) 
En el caso B 4 C, se tiene 


Ule = [vilo < Ha) le = [ve 
de modo que 
[Mes z [vi]e pes [vale] 
= Peen 


la matriz de cambio de base de Ba C. \ 


Matrices de transformaciones lineales compuesta e inversa 


Ahora se generalizarán los Teoremas 3.32 y 3.33 para obtener un teorema que permitirá 
encontrar fácilmente la inversa de una transformación lineal entre espacios vectoriales 
de dimensión finita (si existe). 
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Teorema 6.27 


Sean U, V y W espacios vectoriales de dimensión finita con bases B, C y D, respecti- 
vamente. Sean T : U — V y S : V — W transformaciones lineales. Entonces 


[S ° Tjoes = [S]p-elT]c-s 


Comentarios 

+ En palabras, este teorema dice: “la matriz de la compuesta es el producto de las 
matrices”. 

+ Note cómo los “subíndices interiores” C deben coincidir y parecen cancelarse 
mutuamente, lo que deja los “subíndices exteriores” en la forma DB. 


Demostración Se demostrará que las columnas correspondientes de las matrices 
[S° Tios y [S]pec|T]ceg son iguales. Sea v, el ¡-ésimo vector base en B. Entonces la 
¡-ésima columna de [S ° T]peg es 


(S ° Div) Jo = [SCT(w;)] 


Y 


por dos aplicaciones del Teorema 6.26. Pero |v;]g = e; (¿por qué?), de modo que 


[Slpcd Tlecslv;g = [Slpcel Tle<se; 


es la ¡-ésima columna de la matriz [S]p._¿[ Tlc.g. Por tanto, las ¡-ésimas columnas de 
[S° Tlock y [SIpccl T]eg son iguales, como se quería demostrar. _A 


> 


Ejemplo 6.81 


Use métodos matriciales para calcular (S + T) | s para las transformaciones lineales 
S y T del ejemplo 6.56. 
Solución Recuerde que T : R? —> P, y S: P, > P, están definidas por 

00 = a+ (a+b) y  S(a+ bx) = ax + bx?’ 


Al elegir las bases estándar €, €” y E” para R?, P, y P,, respectivamente, se ve que 


(Verifique esto.) Por el Teorema 6.27, la matriz de S ° T con respecto a € y €” es 


[S° Tere = [S]e 


II 
omo 
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Por tanto, por el Teorema 6.26, 


¡-Df)], = 1600], 


a : 
En consecuencia, (S° T JM = ax + (a + b)x?, que concuerda con la solución al 


e: 


En el Teorema 6.24 se demostró que una transformación lineal es invertible si y sólo 
si es inyectiva y sobreyectiva (esto es, si es un isomorfismo). Cuando los espacios vecto- 
riales involucrados son de dimensión finita, puede usar los métodos matriciales desarro- 
llados para encontrar la inversa de tal transformación lineal. 


ejemplo 6.56. 


Teorema 6.28 


Sea T : V —> W una transformación lineal entre espacios vectoriales V y W de n-di- 
mensiones, y sean B y C bases para V y W, respectivamente. Entonces T es invertible 
si y sólo si la matriz | T]e-g es invertible. En este caso, 


(Tees) >= MA: 


Demostración Observe que las matrices de T y T” (si existen) son de n X n. Si Tes in- 
vertible, entonces T~! o T = Iy. Al aplicar el Teorema 6.27, se tiene 


L, = [Iy]g 


[T "° T]s 
[T "]gecdT]ceg 


Esto demuestra que [T ] ¿._ y es invertible y que ([T]ecg) | = [Tec 

Por el contrario, suponga que A = [T ] e.g es invertible. Para demostrar que T es in- 
vertible, es suficiente demostrar que ker(T) = {0}. (¿Por qué?) Para este fin, sea v que 
está en el kernel de T. Entonces T (v) = 0, de modo que 


Alv]s = [Tlecelv]s = [T(v) le = [0]c = 0 


lo que significa que [y] está en el espacio nulo de la matriz invertible A. Por el Teorema 
fundamental, esto implica que [y]y = 0, lo cual, a su vez, implica que v = 0, como se re- 
quiere. — 


> 


Ejemplo 6.82 


En el ejemplo 6.70 se demostró que la transformación lineal T: R? —P, definida por 
a 
rl =a + (a + b)x 


era inyectiva y sobreyectiva, y por tanto invertible. Encuentre T”?. 
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Solución En el ejemplo 6.81 se encontró que la matriz de T con respecto a las bases es- 
tándar € y €' para R° y P,, respectivamente, era 


Por el Teorema 6.28 se tiene que la matriz de T~! con respecto a €” y € es 


les = (He = k T ~ | i 1 


1 1 


Por el Teorema 6.26, 


Esto significa que 


T~!(a + bx) = ae, + (b — a)e, = P k al 


(Note que la elección de la base estándar hace este cálculo virtualmente irrelevante.) 


"l 


Fl siguiente ejemplo, una continuación del ejemplo 6.79, muestra que las matrices 
pueden usarse en ciertos problemas de integración en cálculo. La integral específica que 
se considerará por lo general se evalúa en cursos de cálculo mediante dos aplicaciones de 
la integración por partes. Contraste este procedimiento con el método propuesto. 


> 


oN Ejemplo 6.83 Demuestre que el operador diferencial, restringido al subespacio W = gen(e*, xe”, 
x2e*) de D, es invertible, y use este hecho para encontrar la integral 


| xe” dx 


Solución En el ejemplo 6.79 se encontró que la matriz de D con respecto a la base 
B = {e™, xe™, x’e™} de W era 


310 
[Dlp=|0 3 2 
0.03 


Por tanto, por el Teorema 6.28, D es invertible sobre W, y la matriz de D`! es 


O uw win 
v 
Si 


| 


wi= WIN 


3 
l 

Lo 

jo] 

II 
Zo 
~m 
SA 
jos] 
Y 

l 

II 
O © u 
O 40 ha 
CES) 

II 
O O we 
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Puesto que la integración es antiderivación, esta es la matriz correspondiente a la inte- 


gración sobre W. Se desea integrar la función x*e** cuyo vector coordenado es 
0 
[xe] = | 0 
1 


En consecuencia, por el Teorema 6.26, 


| | veas = [D"Ua?e*)]y 


= [D"p[x*"] 
373 || 7 
=10 e [0|=|-5 
0 0 3 3 


E 2 2 1 
[ee dx = e” xe” xe 


(Para estar plenamente correctos, es necesario sumar una constante de integración. Aquí 
no se muestra porque se trabaja con transformaciones lineales, que deben enviar vecto- 
res cero a vectores cero, lo que fuerza que la constante de integración también sea cero.) 


"i 


Advertencia En general, la derivación no es una transformación invertible. (Vea el 
ejercicio 22.) Lo que demuestra el ejemplo precedente es que, restringida de manera ade- 
cuada, en ocasiones sí lo es. Los ejercicios 27-30 exploran más esta idea. 


Suponga que T: V — V es una transformación lineal y B y C son dos bases diferente para 
V. Es natural preguntar cómo se relacionan las matrices [T ] y y [T ]e, si es que lo hacen. 
Es evidente que la respuesta a esta pregunta es bastante satisfactoria y se relaciona con al- 
gunas preguntas que se consideraron por primera vez en el capítulo 4. 

La figura 6.12 sugiere una forma de abordar este problema. Al seguir las flechas alre- 
dedor del diagrama, desde la esquina superior izquierda hasta la esquina inferior dere- 
cha, en dos caminos diferentes, pero equivalentes, se demuestra que I° T = To I, algo 
que ya se sabía, pues ambas son iguales a T. Sin embargo, si la versión “superior” de T es 


V T V 
—> > base C 
ev eT(v) 
ye pe 
V r V > 
= > base B 
ev eT(v) 


Figura 6.12 
leT=To] 
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con respecto a la base C y la versión “inferior” es con respecto a B, entonces T = I° T = 
T° I es con respecto a C en su dominio y con respecto a 5 en su codominio. Por tanto, la 
matriz de T en este caso es [T]y._¿. Pero 


[Tlgee = [1 > Teee = geedl Tlece 


[T]sec = [T° I]se = [T]segl gcc 


Así que, [1]g cl Tleec = [T]s-sH]gec 
A partir del ejemplo 6.80, se sabe que [1] g._¿ = Pgao la matriz (invertible) de cam- 


bio de base de C a B. Si esta matriz se denota P, entonces también se tiene 


P` = (Proc) * = Pecs 


Con esta notación, 
P[Tlece = [Tls-gP 
de modo que [Tleec=P[TIsogP 0 [T]e =P [T]8P 


Por tanto, las matrices [ T]y y [T] ¿ son similares, en la terminología de la sección 4.4. 
La discusión anterior se resume como teorema. 


Teorema 6.29 


Sea V un espacio vectorial de dimensión finita con bases $ y C y sea T: V> V una 
transformación lineal. Entonces 


Pie = A 


donde P es la matriz de cambio de base de C a B. 


Comentario Como auxiliar para recordar que P debe ser la matriz de cambio de 
base de C a B y no de B a C, es instructivo observar lo que dice el Teorema 6.29 cuando 
se escribe con todo detalle. Como se muestra a continuación, los “subíndices interiores” 
deben ser iguales (todos 5) y deben parecer cancelarse, lo que deja los “subíndices exte- 
riores”, que son ambos C. 


[T] c = Peal Th —e Pee 
I O 


Igual Igual 
Igual 


Con frecuencia se usa el Teorema 6.29 cuando se intenta encontrar una base con res- 
pecto a la cual la matriz de una transformación lineal es particularmente simple. Por 
ejemplo, es posible preguntar si existe una base C de V tal que la matriz [T ] ¿ de T : V—> V 
es una matriz diagonal. El ejemplo 6.84 ilustra esta aplicación. 


Ejemplo 6.84 


Sea Ts R => R definida mediante 
T y 


Si es posible, encuentre una base C para R? tal que la matriz de T con respecto a C sea dia- 
gonal. 
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Solución La matriz de T con respecto a la base estándar € es 


mel 


Esta matriz es diagonalizable, como se vio en el ejemplo 4.24. De hecho, si 


e al 


entonces P”'[T]¿P = D. Si se hace C la base de R? consistente de las columnas de P, en- 
tonces P es la matriz de cambio de base Pg._¿ de C a €. Por el Teorema 6.29, 


[1¿8111P3D 


de modo que la matriz de T con respecto a la base C = l | A | i } es diagonal. 


o Es fácil comprobar que la solución anterior es correcta al calcular directamente 
[T] ¿. Se encuentra que 


dida da La 


Por tanto, los vectores coordenados que forman las columnas de [T ]ẹ son 


Cll > La) 


en concordancia con la solución anterior. 

+ El procedimiento general para un problema como el ejemplo 6.84 es tomar la 
matriz estándar [T]¿ y determinar si es diagonalizable al encontrar bases para sus 
eigenespacios, como en el capítulo 4. Entonces la solución procede exactamente como en 
el ejemplo anterior. 

El ejemplo 6.84 motiva la siguiente definición. 


Definición Sea V un espacio vectorial de dimensión finita y sea T : V> V una 
transformación lineal. Entonces T se llama diagonalizable si existe una base C para V 
tal que la matriz [T']¿ sea una matriz diagonal. 


No es difícil demostrar que, si B es cualquier base para V, entonces T es diagonaliza- 
ble si y sólo si la matriz [T]z es diagonalizable. En esencia esto es lo que se hizo, para un 
caso especial, en el último ejemplo. En el ejercicio 42 se le pide probar este resultado en 
general. 

En ocasiones es más sencillo escribir la matriz de una transformación lineal con res- 
pecto a una base “no estándar”. Entonces puede invertir el proceso del ejemplo 6.84 para 
encontrar la matriz estándar. Esta idea se ilustra al revisar nuevamente el ejemplo 3.59. 


> 


d 
Sea € la recta que pasa por el origen en R? con vector de director d = | Pi . Encuentre la 
matriz estándar de la proyección sobre £. i 
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Solución Sea T la proyección. No hace daño suponer que d es un vector unitario (es 
decir, dî + d} = 1), pues cualquier múltiplo de d distinto de cero puede servir como un 
. , =d, , 
vector director para £. Sea d' = J de modo que d y d' son ortogonales. Dado que 
1 
d' también es un vector unitario, el conjunto D = {d, d') es una base ortonormal 


para R?, 
Como muestra la figura 6.13, T(d) = d y T(d') = 0. Por tanto, 


ra= || y (r(8)lo = l] 


0 0 
y 
A 
XA 
\ 
\ 
AN 
V 
d \ € 
T(y) Tx) 
T(d)=0 E 
EN ia T(d) = d 
\ 
X 
\ 
vy 
Figura 6.13 
Proyección sobre € 
1.0 
así Tl, = 
o = |, 2 
La matriz de cambio de base de D a la base estándar € es 
di E 
P = 
ED le d, 


de modo que la matriz de cambio de base de £ a D es 


a d =N d d 
Poeg = (Pep) j = le A = | f l 
2 1 


Entonces, por el Teorema 6.29, la matriz estándar de T es 
[Tle = Pecol TloPp.e 
Ale” alo leal 
d, di 110 OJL—d, d 
z | d? i] 
dd, di 


lo que concuerda con el inciso (b) del ejemplo 3.59. | 
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y 


Sea T: P, —>P, la transformación lineal definida por 


T(p(x)) = p(2x — 1) 


(a) Encuentre la matriz de T con respecto a la base B = {1 + x, 1 — x,x*) de P,. 


(b) Demuestre que T es diagonalizable y encuentre una base C para P, tal que [T ] ¿sea 
una matriz diagonalizable. 


Solución (a) En el ejemplo 6.78 se encontró que la matriz de T con respecto a la base 
estándar E = {1, xx?) es 


1 1 1 
[Tle=|0 2 -4 
0 0 4 
La matriz de cambio de base de B a € es 
1 1.0 
P=Peg=|1 -1 0 
0 0 1 


Se tiene que la matriz de T con respecto a B es 


[T]g = P [T]eP 


3 3 01 -1 ılı 100 
=|3 3 0 [06 2 —4||1 -1 
o o 1ijlo o «ajlo 01 
1.03 
=|-1 2 3 

00 4 


(Compruébelo.) 


(b) Los eigenvalores de [T'] son 1, 2 y 4 (¿por qué?), así que, del Teorema 4.25, se sabe 
que [T]; es diagonalizable. Los eigenvectores correspondientes a estos eigenvalores son 


1 =1 1 
0 |, 1||-2 
0 0 1 


1-1 1 1.0.0 
P=|0 1 -2| y D=|0 20 
0. 0 1 0 0 4 


se tiene P '[T]¿P = D. Más aún, P es la matriz de cambio de base de una base C a € y las 
columnas de P son por tanto los vectores coordenados de C en términos de E. Se con- 
cluye que 

C= {1,—1 +x, 1 -— 2x + x’} 
y[T]e = D. 


ei 
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Las ideas anteriores pueden generalizarse para relacionar las matrices [T ]e g y 
[T lo. y de una transformación lineal T : V —> W, donde B y B’ son bases para V y C y 
C' es base para W. (Vea el ejercicio 44.) 

Esta sección concluye con una revisión del teorema fundamental de las matrices in- 
vertibles e incorpora algunos resultados de este capítulo. 


Teorema 6.30 El teorema fundamental de las matrices invertibles: versión 4 


Sea A una matriz de n X n y sea T: V—> W una transformación lineal cuya matriz 
[TJ g con respecto a las bases B y C de V y W, respectivamente, es A. Las siguientes 
afirmaciones son equivalentes: 


A es invertible. 

Ax = b tiene una solución única para todo b en R”. 

Ax = 0 tiene sólo la solución trivial. 

. La forma escalonada reducida por renglones de A es 1,. 

A es un producto de matrices elementales. 

rank(A) = n 

. nulidad(A) = 0 

. Los vectores columna de A son linealmente independientes. 

Los vectores columna de A generan R”. 

Los vectores columna de A forman una base para R”. 

. Los vectores renglón de A son linealmente independientes. 
Los vectores renglón de A generan R”. 

. Los vectores renglón de A forman una base para R”. 

< det A0 

0 no es un eigenvalor de A. 

. T es invertible. 

. T es inyectiva. 

T es sobreyectiva. 

ker(T) = {0} 

rango(T) = W 


PPROBOparoparrpas mnp aNg 


Demostración La equivalencia (q)=(s) es el Teorema 6.20 y (1) 2t) es la definición 
de sobreyectiva. Dado que A es de n X n, debe tener dim V = dim W = n. A partir de los 
Teoremas 6.21 y 6.24, se obtiene (p)=(q)21(1). Finalmente, los últimos cinco enuncia- 
dos se conectan con los demás mediante el Teorema 6.28, que implica que (a) =p). 


— 
Í tjercicios 6.6 S 
En los ejercicios 1-12, encuentre la matriz [T |e. g de la trans- 2. T:P,—> P, definida mediante Tía + bx) = b — ax 
formación lineal T : V —> W con respecto a las bases B y C de B= (1 cad 1x0 =(L,x)v= p(x) =4+2x 


V y W, respectivamente. Verifique el Teorema 6.26 para el vec- 
tor v al calcular directamente T(v) y usar el teorema. 
1. T : P, >9, definida mediante Tía + bx) = b — ax, 
B =C = {1, x}, v = p(x) = 4 + 2x 


3. T: P, — P, definida mediante T(p(x)) = p(x + 2), 
B = {1,x, x}, C = {1,x +2, (x + 2)}, 


v= p(x) =a + bx + cx? 


4. T: P, — P, definida mediante T(p(x)) = p(x + 2), 
B = {1,x + 2, (x + 27}, C =(L,x,x7), 
v= p(x) =a + bx + c 


0 
5. T: P, —> R? definida mediante T(p(x)) = p ) 


B =(1,x,x?), C = fe, e), 
v= p(x) =a + bx+ ax? 


6. T: P, —> R definida mediante T(p(x)) = la 


s-e (EJ) 


v = p(x) =a + bx + cx? 
7. T: R? — R? definida mediante 


, a + 2b i 3 
T |5 —a , B= 2P —1 > 
b 
1 1 1 
=7 
C= O lT l Ti? y=| | 
7 
0 0 1 


go 


Repita el ejercicio 7 con v = el 


9. T: M, > M, definida mediante T(A) = A", B = C = 


a b 
Ep Ep En, Ey), v = A = 
(Er 122 E21 22) V ll f 


10. Repita el ejercicio 9 con B = {Ez E2, Ej» En} y 
C = {En Ezp E2» E11}. 

11. T: M,, > M, definida mediante T(A) = AB — BA, 
donde 


1 -1 
p=| i 1 8=C= (Ep Em En Ea), 


=4=|1 A 
y cd 


12. T: M,, > M,, definida mediante T(A) = A — A", 


a b 
B = C= (Er Ei» Exp En} v = A = h l 


E13. Considere el subespacio W de %, dado por W = 


gen(sen x, cos x). 

(a) Demuestre que el operador diferencial D mapea a 
W en sí mismo. 

(b) Encuentre la matriz de D con respecto a B = {sen x, 
cos x}. 

(c) Calcule indirectamente la derivada de f(x) = 3 sen x 
— 5 cos x , use el Teorema 6.26 y verifique que con- 
cuerda con f'(x) como si se hubiera calculado direc- 
tamente. 
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[5 14. Considere el subespacio W de Y, dado por W = gen(e”, 


e). 

(a) Demuestre que el operador diferencial D mapea a 
W en sí mismo. 

(b) Encuentre la matriz de D con respecto a B = fe”, 
es. 

(c) Calcule indirectamente la derivada de f(x) = e*— 
3e”, use el Teorema 6.26 y verifique que concuerda 
con f'(x) como si se hubiera calculado directamente. 


[3 15, Considere el subespacio W de YD, dado por W = gen(e”, 


e” cos x, e” sen x). 

(a) Encuentre la matriz de D con respecto a B = [e”, 
e” cos x, e” sen x}. 

(b) Calcule indirectamente la derivada de f(x) = 3e* — 
e*cosx + 2e” sen usando el Teorema 6.26 y verifi- 
que que concuerda con f'(x) como si se hubiera cal- 
culado directamente. 


[2% 16. Considere el subespacio W de D, dado por W = 


gen (cos x, sen x, x COS x, x Sen x). 

(a) Encuentre la matriz de D con respecto a B = {cos x, 
sen x, x cos x, x sen x}. 

(b) Calcule indirectamente la derivada de f(x) = cos x 
+ 2x cos x , usando el Teorema 6.26 y verifique que 
concuerda con f'(x) como si se hubiera calculado 
directamente. 


En los ejercicios 17 y 18, T : U — V y S : V — W son transfor- 
maciones lineales, y B, C, y D son bases para U, V y W, 
respectivamente. Calcule [S° T ] pog en dos formas: (a) al en- 
contrar directamente S ° T y luego calcular su matriz y (b) al 
encontrar las matrices de S y T por separado y usar el 
Teorema 6.27. 


17. T: P, — R? definida mediante T(p(x)) = P f S: 


R? > R? definida mediante 


H = o =p 


18.7: P, >, definida mediante T(p(x)) = p(x + 1), 
S: P, > P, definida mediante S(p(x)) = p(x + 1), 
B=(1x)C=D= (Lx x) 


En los ejercicios 19-26, determine si la transformación lineal T 
es invertible al considerar su matriz con respecto a las bases es- 
tándar. Si T es invertible, use el Teorema 6.28 y el método del 
ejemplo 6.82 para encontrar T ~. 


19. T en el ejercicio 1 20. T en el ejercicio 5 
21. T en el ejercicio 3 


22. T : P, >, definida mediante T(p(x)) = p'(x) 
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14.23. T: P, — P, definida mediante T(p(x)) = p(x) + p' (x) 


24. T : M,, > M, definida mediante T(A) = AB, donde 


ao 


25. T en el ejercicio 11 26. T en el ejercicio 12 


En los ejercicios 27-30, use el método del ejemplo 6.83 para 
evaluar la integral dada. 


2. J (sen x — 3 cos x)dx. (Vea el ejercicio 13.) 
28. f 5e™™ dx. (Vea el ejercicio 14.) 
29. f (e™ cosx — 2e” sen x) dx. (Vea el ejercicio 15.) 
30. f (x cos x + x sen x) dx. (Vea el ejercicio 16.) 


En los ejercicios 31-36, está dada una transformación lineal 
T: V> V. Si es posible, encuentre una base C para V tal que la 
matriz | T]¿ de T con respecto a C sea diagonal. 


31. T: R? — R? definida mediante r| = | =a | 
b a + 5b 


32. T : R? — R? definida mediante re - F p a 
b a+b 


33. T: P| >, definida mediante T(a + bx) = (4a + 2b) 
+ (a + 3b)x 


34. T : P, — P, definida mediante T(p(x)) = p(x + 1) 
1.35. T: P, — P definida mediante T(p(x)) = p(x) + xp'(x) 


36. T: P, >, definida mediante T(p(x)) = p(3x + 2) 
37. Sea € la recta que pasa por el origen en [R?, con vector 


d 
director d = | Al Use el método del ejemplo 6.85 


2 
para encontrar la matriz estándar de una reflexión en £. 
38. Sea W el plano en R*con ecuación x — y + 2z = 0. Use 
el método del ejemplo 6.85 para encontrar la matriz es- 


tándar de una proyección ortogonal sobre W. Verifique 
que su respuesta es correcta usándola para calcular la 
proyección ortogonal de v sobre W, donde 
3 
v=|-1 
2 


Compare su respuesta con el ejemplo 5.11. [Sugerencia: 
encuentre una descomposición ortogonal de R? como 
R° = W + W+ usando una base ortogonal para W. Vea 
el ejemplo 5.3.] 


39. Sea T : V —> W una transformación lineal entre espacios 
vectoriales de dimensión finita y sean B y C bases para V 
y W, respectivamente. Demuestre que la matriz de T con 
respecto a B y C es única. Esto es, si A es una matriz tal 
que A[v] = [T(v) ]¿ para todo v en V, entonces 
A=|[Tlecg. [Sugerencia: encuentre valores de v que 
demostrarán esto, una columna a la vez. | 


En los ejercicios 40-45, sea T : V —> W una transformación li- 
neal entre espacios vectoriales de dimensión finita V y W. Sean 
B y C bases para V y W, respectivamente, y sea A = [Tle-g. 


40. Demuestre que nulidad(T) = nulidad(A). 
41. Demuestre que rank(T) = rank(A). 


42. Si V = Wy B = C, demuestre que T es diagonalizable si 
y sólo si A es diagonalizable. 


43. Use los resultados de esta sección para dar una prueba 
basada en las matrices del Teorema del rank (Teorema 
6.19). 


44. Si B' y C” también son bases para V y W, respectiva- 
mente, ¿cuál es la relación entre [T ]e gy [T ]e g 
Pruebe su afirmación. 

45. Si dim V = n y dim W = m, demuestre que £(V, W) = 
M „n: (Vea los ejercicios de la sección 6.4.) [Sugerencia: 
sean B y C bases para V y W, respectivamente. Demues- 
tre que el mapeo p(T) = [T le, pg, para Ten L£(V, W), 
define una transformación lineal y: £ (V, W) > M „n 
que es un isomorfismo. ] 

46. Si V es un espacio vectorial, entonces el espacio dual de 
V es el espacio vectorial V* = £(V, R). Demuestre que 
si Ves de dimensión finita, entonces V* = V, 


E l 1Ó 


Mosaicos, retículas y la restricción 
cristalográfica 


En la naturaleza y el arte frecuentemente se encuentran patrones. La estructura molecu- 
lar de los cristales con frecuencia muestran repetición, así como los azulejos y mosaicos 
que se encuentran en las obras artísticas de muchas culturas. Embaldosar (o azulejar) es 
cubrir un plano con formas que no se traslapan ni dejan espacios. El artista holandés M. 
C. Escher (1898-1972) produjo muchas obras en las que exploró la posibilidad de em- 
baldosar un plano con figuras fantásticas (figura 6.14). 


M. C. “Escher's Symmetry Drawing E103” © 2004 The M. C. Escher Company-Baarn—Holland. 


Todos los derechos reservados. 


Figura 6.14 
“Dibujo simétrico E103” de M. C. Escher 


M. C. “Escher's Symmetry Drawing E103” © 2004 The M. C. Escher Company-Baarn—Holland. Todos 


los derechos reservados. 
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M. C. "Escher's Symmetry Drawing E103” O 2004 The M. C. Escher Company-Baarn—Holland. Todos 


los derechos reservados. 


Figura 6.15 Figura 6.17 

Invarianza bajo traslación Simetría rotacional 

“Dibujo simétrico E103” de M. C. Escher “Dibujo simétrico E103” de M. C. Escher 
e o o e e 


Figura 6.16 


Una retícula 


Esta exploración se interesa en los patrones como los de la figura 6.14, que se supone 
son infinitos y repetitivos en todas las direcciones del plano. Tal patrón tiene la propie- 
dad de que puede recorrerse (o trasladarse) en al menos dos direcciones (que corres- 
ponden a dos vectores linealmente independientes), de modo que parece que no se mo- 
vieron en absoluto. Se dice que el patrón es invariante bajo traslaciones y tiene simetría 
traslacional en dichas direcciones. Por ejemplo, el patrón de la figura 6.14 tiene simetría 
traslacional en las direcciones que se muestran en la figura 6.15. 

Si un patrón tiene simetría traslacional en dos direcciones, tiene simetría traslacio- 
nal en infinitas direcciones. 


1. Sean u y v los dos vectores que se muestran en la figura 6.15. Demuestre que el 
patrón de la figura 6.14 es invariante por traslación para cualquier combinación lineal 
entera de u y v; esto es, por cualquier vector de la forma au + bv, donde a y b son en- 
teros. 


Para cualesquiera vectores linealmente independientes u y v en R?, el conjunto de 
puntos determinado por todas las combinaciones lineales enteras de u y v se llama retí- 
cula. La figura 6.16 muestra un ejemplo de una retícula. 


2. Dibuje la retícula correspondiente a los vectores u y v de la figura 6.15. 


La figura 6.14 también muestra simetría rotacional. Esto es, es posible rotar todo el 
patrón en torno a algún punto y que parezca no cambiar. Se dice que es invariante ante 
tal rotación. Por ejemplo, el patrón de la figura 6.14 es invariante ante una rotación de 
120° en torno al punto O, como se muestra en la figura 6.17. A O se le llama centro de si- 
metría rotacional (o centro de rotación). 

Note que si un patrón se basa en una retícula subyacente, entonces la retícula tam- 
bién debe poseer cualquier simetría del patrón. 


3. Explique por qué si un punto O es un centro de rotación en un ángulo 6, en- 
tonces es un centro de rotación para todo múltiplo entero de 0. Deduzca que, si 0 < 0 <= 
360%, entonces 360/0 debe ser un entero. (Si 360/0 = n, se dice que el patrón o retícula 
tiene simetría rotacional n-tuple.) 


4. ¿Cuál es el menor ángulo positivo de simetría rotacional para la retícula del problema 2? 
¿El patrón de la figura 6.14 también tiene simetría rotacional a través de este ángulo? 


5. Tome varios valores de 8 tales que 0 < 0 = 360° y 360/0 es entero. Intente dibu- 
jar una retícula que tenga simetría rotacional a través del ángulo 6. En particular, ¿puede 
dibujar una retícula con simetría rotacional óctuple? 


Se demostrará que los valores de 0 que son posibles ángulos de simetría rotacional 
para una retícula están severamente restringidos. La técnica que se usará es considerar 
transformaciones rotacionales en términos de diferentes bases. En concordancia, sea R, 
una rotación en torno al origen en un ángulo 0 y sea € la base estándar para [R?. Enton- 
ces la matriz estándar de R, es 


[Rs] e sl 
pag sen 0 cos 0 


6. Con referencia a los problemas 2 y 4, tome el origen como los orígenes de u y v. 


(a) ¿Cuál es el valor real (es decir, numérico) de [Ry]. en este caso? 
(b) Sea B la base {u, v}. Calcule la matriz [Ry]. 


7. En general, sean u y v dos vectores linealmente independientes cualesquiera en 
R? y suponga que la retícula determinada por u y v es invariante ante una rotación en un 
ángulo 6. Si B = {u, v}, demuestre que la matriz de R, con respecto a B debe tener la 


forma 
a b 
Risa 
A 


8. En la terminología y notación del problema 7, demuestre que 2 cos 0 debe ser un 
entero. [Sugerencia: use el ejercicio 35 de la sección 4.4 y el Teorema 6.29.] 


donde a, b, c y d son enteros. 


9. Con el problema 8, elabore una lista de todos los posibles valores de 6, con 0 < 
0 = 360°, que puedan ser ángulos de simetría rotacional de una retícula. Registre los va- 
lores correspondientes de n, donde n = 360/0, para demostrar que una retícula puede 
tener simetría rotacional n-tuple si y sólo si n = 1, 2, 3, 4 o 6. Este resultado, conocido 
como la restricción cristalográfica, la probó por primera vez W. Barlow en 1894. 


10. Enla biblioteca o la Internet, vea si puede encontrar un mosaico de Escher para 
cada uno de los cinco tipos posibles de simetría rotacional; esto es, donde el menor án- 
gulo de simetría rotacional del patrón sea uno de los especificados por la restricción 
cristalográfica. 
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Aplicaciones 


Ecuaciones diferenciales lineales homogéneas 


En los ejercicios 69-72 de la sección 4.6, se demostró que si y = y(t) es una función do- 
blemente derivable que satisface la ecuación diferencial 


y" +ay +by=0 (1) 
entonces y es de la forma 
y = qe + ge 


si A, y A, son distintas raíces de la ecuación característica asociada A? + aà + 
b = 0. (El caso en que A, = A, se dejó sin resolver.) El ejemplo 6.12 y el ejercicio 20 de 
esta sección demuestran que el conjunto de soluciones a la ecuación (1) forman un 
subespacio de F, el espacio vectorial de funciones. En esta sección se da mayor segui- 
miento a estas ideas, y se pone particular atención en el papel que desempañan los espa- 
cios vectoriales, las bases y la dimensión. 

Para preparar el escenario, considere una clase más simple de ejemplos. Una ecua- 
ción diferencial de la forma 


y +ay=0 (2) 


se llama ecuación diferencial lineal homogénea de primer orden. (“Primer orden” se re- 
fiere al hecho de que la derivada más alta que se involucra es una primera derivada y “ho- 
mogénea” significa que el lado derecho es cero. ¿Ve por qué la ecuación es “lineal”?) Una 
solución a la ecuación (2) es una función derivable y = y (t) que satisface la ecuación (2) 
para todos los valores de t. 

Es fácil comprobar que una solución a la ecuación (2) es y = e ”. (Hágalo.) Sin em- 
bargo, se quieren describir todas las soluciones, y es aquí donde entran los espacios vec- 
toriales. Se tiene el siguiente teorema. 


Teorema 6.31 


El conjunto S de todas las soluciones de y” + ay = 0 es un subespacio de Y. 


Demostración Dado que la función cero ciertamente satisface la ecuación (2), S no está 
en el vacío. Sean x y y dos funciones derivables de t que están en S y sea c un escalar. En- 
tonces 


x +ax=0 y y +ay=0 
de modo, que al usar las reglas de derivación, se tiene 
(x+y) +ax+ y) =x +y +ax+ ay=(x + ax) + (y +ay)=0+0=0 


y 


(cy) + alcy) = cy" + c(ay) = c(y' + ay) =c-0=0 


Por tanto, x + y y cy también están en S, de modo que S es un subespacio de F. 


Ahora se demostrará que S es un subespacio unidimensional de F y que [e] es una 
base. Para este fin, sea x = x(t) que está en S. Entonces, para toda t, 


x'(t) + ax(t)=0 o x(t) = —ax(t) 
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Defina una nueva función z (t) = x(1) e”. Luego, por la regla de la cadena para la deriva- 
ción, 

z'(t) = x(t)ae" + x'(t)e” 
ax(t)e” — ax(t)e" 
=0 


t 


Dado que z' es idénticamente cero, z debe ser una función constante, por decir, z(t) 
= k. Pero esto significa que 


x(1)e" =z(1) =k para toda t 


de modo que x(t) = ke”. Por tanto, todas las soluciones a la ecuación (2) son múltiplos 
escalares de la solución única y = e”. Se demostró el siguiente teorema. 


Teorema 6.32 


Si S es el espacio solución de y” + ay = 0, entonces dim S = 1 y [e “] es una base 
para S. 


Un modelo para el crecimiento poblacional supone que la tasa de crecimiento de la po- 
blación es proporcional al tamaño de la población. Este modelo funciona bien si existen 
pocas restricciones (como espacio o alimento limitados, o cosas por el estilo) para el creci- 
miento. Si el tamaño de la población en el tiempo t es p(t), entonces la tasa de crecimiento, 
o razón de cambio de la población, es su derivada p'(t). La suposición de que la tasa de 
crecimiento de la población es proporcional a su tamaño puede escribirse como 


p'(t) = kp(t) 


donde k es la constante de proporcionalidad. Por ende, p satisface la ecuación diferencial 
p' — kp = 0, de modo que, por el Teorema 6.32, 


p(t) = ce" 


para algún escalar c. Las constantes c y k se determinan con el uso de datos experimenta- 
les. 


Ejemplo 6.87 


La E. coli se menciona en la novela 
de Michael Crichton, The Andro- 
meda Strain (Nueva York: Dell, 
1969), aunque el “villano” en la 
novela supuestamente fue un virus 
extraterrestre. En la vida real, la 

E. coli contaminó el suministro de 
agua de la ciudad de Walkerton, 
Ontario, en 2000, lo que resultó en 
siete muertes y provocó que cien- 
tos de personas enfermaran seria- 
mente. 


> 


La bacteria Escherichia coli (o E. coli, para abreviar) se encuentra comúnmente en los in- 
testinos de los humanos y otros mamíferos. Plantea severos riesgos a la salud si escapa 
hacia el ambiente. En condiciones de laboratorio, cada célula de la bacteria se divide en 
dos cada 20 minutos. Si comienza con una sola célula de E. coli, ¿cuántas habrá después 
de un día? 


Solución No es necesario usar ecuaciones diferenciales para resolver este problema, 
pero se hará, con la finalidad de ilustrar el método básico. 

Para determinar c y k, se usan los datos dados en el enunciado del problema. Si se 
toma 1 unidad de tiempo como 20 minutos, entonces se tiene p(0) = 1 y p(1) = 2. Por 
tanto, 


== 


cac i= ges] y 
Se tiene que k = In 2, de modo que 
p(t) = et? = em? = 2! 


Después de 1 día, t = 72, de modo que el número de células bacterianas será p(72) = 2”? 
= 4.72 X 10” (vea la figura 6.18). 
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p) 
A 


5 Xx 1021+ 4.72 X 10?! 


4 x 101+ 


310l 


2 X 1021+ 


1 x 1021+ 


0 
0 10 20 30 40 50 60 Us 


Figura 6.18 


Crecimiento exponencial 


e.. 


Las sustancias radiactivas se desintegran al emitir radiación. Si m(t) denota la masa 
de la sustancia en el tiempo t, entonces la tasa de desintegración es m’ (t). Los físicos 
descubrieron que la tasa de desintegración de una sustancia es proporcional a su masa; 
esto es, 


m(t) =km(t) o m —km=0 
donde k es una constante negativa. Al aplicar el Teorema 6.32, se tiene 
m(t) = ce" 


para alguna constante c. El tiempo requerido para que la mitad de una sustancia radiac- 
tiva se desintegre se llama vida media. 


Ejemplo 6.88 Después de 5.5 días, una muestra de 100 mg de radón 222 desintegra a 37 mg. 


(a) Encuentre una fórmula para m(t), la masa restante después de t días. 
(b) ¿Cuál es la vida media del radón 222? 


(c) ¿Cuándo quedarán solamente 10 mg? 


Solución (a) A partir de m(t) = cel", se tiene 


100 = m(0) = ce? = c-1 =c 


de modo que m(t) = 100e" 


Con el tiempo medido en días, se tiene m(5.5) = 37. Por tanto, 


100e*% = 37 
de modo que ek = 0,37 
Al despejar k, se encuentra 
5.5k = In(0.37) 
de modo que k= ma = 0.18 


Por tanto, m(t) = 100e 018%, 


Vea Linear Algebra de S. H. Fried- 
berg, A. J. Insel y L. E. Spence (En- 
glewood Cliffs, NJ: Prentice-Hall, 
1979). 
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Figura 6.19 


Decaimiento radioactivo 


(b) Para encontrar la vida media del radón 222, se necesita el valor de t para el cual m(t) 
= 50. Al resolver esta ecuación, se encuentra 


100e 0! = 50 
de modo que g = 0.50 
Por tanto, 
0.18t = In) = —In2 
In 2 
y A 0.18 = 3.85 


Por ende, el radón 222 tiene una vida media de aproximadamente 3.85 días. (Vea la fi- 
gura 6.19.) 


(c) Es necesario determinar el valor de t tal que m(t) = 10. Esto es, se debe resolver la 
ecuación 


100% = 10 o e%%= 0.1 
Al tomar el logaritmo natural de ambos lados produce —0.18t = In 0.1. Por tanto, 


ln 0.1 
t = ———* 12,79 
0.18 


de modo que, después de aproximadamente 12.79 días, quedarán 10 mg de la muestra. 


dl 


El conjunto solución de la ecuación diferencial de segundo orden y” + ay" + by = 0 
también es un subespacio de Y (ejercicio 20) y se evidencia que la dimensión de S es 2. El 
inciso (a) del Teorema 6.33, que se extiende al Teorema 6.32, se implica con el Teorema 
4.40. Aquí el planteamiento es usar el poder de los espacios vectoriales; hacerlo permite 
obtener también la parte (b) del Teorema 6.33, un resultado que no podría obtenerse con 
los métodos previos. 
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Teorema 6.33 


>< 


Figura 6.20 


l 
j 
A 


Sp coses 


>X 


Sea S el espacio solución de 
y" + ay'+by=0 
y sean À; y À, las raíces de la ecuación característica A? + aà + b = 0. 


a. Si À; + A, entonces {e™, e™} es una base para S. 
b. Si A, = A, entonces [e?*, te?) es una base para S. 


Comentarios 
+ Observe que lo que dice el teorema, en otras palabras, es que las soluciones de 
y” + ay' + by = 0 son de la forma 


y = «qe + ger 
en el primer caso y 
y = qee + ote* 


en el segundo caso. 

+ Compare el Teorema 6.33 con el Teorema 4.38. Las ecuaciones diferenciales li- 
neales y las relaciones de recurrencia lineal tienen mucho en común. Aunque las 
primeras pertenecen a las matemáticas continuas y las últimas a las matemáticas discre- 
tas, existen muchos paralelismos. 


Demostración (a) Demuestre primero que (e?”, e**) está contenido en S. Sea A cual- 
quier raíz de la ecuación característica y sea f(t) = e”. Entonces 


f =e y f = e 
de donde se tiene que 
f" + af + bf= Xe + are™ + bel 
(+ aà+b)e™ 
=0:-e"=0 


Por tanto, f está en S. Pero, dado que A; y A, son raíces de la ecuación característica, esto 
significa que e^! y e™ están en S. 
El conjunto (e**, e**) también es linealmente independiente, porque si 


ce Wi + ce =0 
entonces, al hacer t = 0, se tiene 
ata=0 o =c 
A continuación, se hace t = 1 para obtener 
ge -— qe =0 o aler—e*)=0 


Pero, e™ — e? # 0, pues e™ — e™ = 0 implica que e™ = e* lo que claramente es imposi- 


ble si A, # A). (Vea la figura 6.20.) Se deduce que c} = 0 y, por tanto, c, = 0, de modo que 
(ek, e**] es linealmente independiente. 


Dado que S = 2, {e™f, e™'} debe ser una base para S. 


(b) Se le pide demostrar esta propiedad en el ejercicio 21. 
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Encuentre todas las soluciones de y” — 5y' + 6y = 0. 


Solución La ecuación característica es A? — 5A + 6 = (À — 2) (à — 3) = 0. Por tanto, 
las raíces son 2 y 3, de modo que {e”, e*') es una base para el espacio solución. Se tiene 
que las soluciones a la ecuación dada son de la forma 


y = qe” + oe” | 


Las constantes c} y C, pueden determinarse si se especifican ecuaciones adicionales, 
llamadas condiciones de frontera. 


Ejemplo 6.90 Encuentre la solución de y” + 6y' + 9y = 0 que satisfaga y(0) = 1, y'(0) = 0. 


Solución La ecuación característica es A? + 64 + 9 = (A + 3)? = 0, de modo que —3 
es una raíz repetida. Por tanto, [e”*, te?) es una base para el espacio solución y la solu- 
ción general es de la forma 
y= qe" + ote” 
La primera condición de frontera produce 
1 =y(0)= ġe” +0= c 
de modo que y = e™™ + c,te™™. Al derivar, se tiene 
yo teo 

así que la segunda condición de frontera produce 

0=y(0) = "+ q(0+ e°") = -3 +6 


o c=3 


Por tanto, la solución requerida es 


y =e” + 3te * = (1 + 3t)e * | 


El Teorema 6.33 incluye el caso en el que las raíces de la ecuación característica son 
complejas. Si A = p + qi es una raíz compleja de la ecuación A? + ad + b = 0, entonces 
también lo es su conjugado A = p — qi. (Vea los Apéndices C y D.) Por el Teorema 
6.33(a), el espacio solución S de la ecuación diferencial y” + ay” + by = 0 tiene {e™, e™} 
como una base. Ahora, 


e™ = eltt = ePrgilad = eP(cos qt + ¡sen qt) 


y e™ = glp = ePi) = eP(cos qt — ¡sen qt) 
i eN + e™ i e™ = e™ 
de modo que e” cos qt = E e” sen qt = a 
1 


Se tiene que {e” cos qt, e” sen qt} está contenido en gen (e™, e™) = S. Puesto que e” cos qt 
y e” sen qt son linealmente independientes (vea el ejercicio 22) y dim S = 2, {e” cos qt, 
e” sen qt} también es una base para S. Por tanto, cuando su ecuación característica tiene 
una raíz compleja p + qi, la ecuación diferencial y” + ay’ + by = 0 tiene soluciones de 
la forma 


= ce” cos gt + oe” sen qt 
y 1 q 2 q 
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Ejemplo 6.91 Encuentre todas las soluciones de y” — 2y' + 4 = 0. 


Solución La ecuación característica es A? — 24 + 4 = 0 con raíces 1 + iV3. El análisis 
anterior dice que la solución general a la ecuación diferencial dada es 


y = që cos V3t + ce! sen V3t | 


> 
Ejemplo 6.92 Una masa está unida al extremo de un resorte vertical (figura 6.21). Si la masa se jala 


hacia abajo y se libera, oscilará arriba y abajo. Dos leyes de la física gobiernan esta situa- 
ción. La primera, la ley de Hooke, afirma que si el resorte se estira (o comprime) x uni- 
dades, la fuerza F necesaria para restaurarlo a su posición original es proporcional a x: 
F= —kx 

donde k es una constante positiva (llamada constante del resorte). La segunda ley del 
movimiento de Newton afirma que la fuerza es igual a la masa por la aceleración. Dado 
que x = x(t) representa la distancia, o desplazamiento, del resorte en el tiempo t, x' pro- 
porciona su velocidad y x'' su aceleración. Por tanto, se tiene 


mx" = —kx o x" + (£) =0 
= = Puesto que tanto k como m son positivas, también lo es K = k/m y la ecuación diferen- 
[nm] o+ s< cial tiene la forma x” + Kx = 0, donde K es positiva. 
Á La ecuación característica es A? + K = 0, con raíces +i VK. Por tanto, la solución ge- 


Pa neral a la ecuación diferencial del resorte en oscilación es 


x = (cos VKt + c sen VKt 


Suponga que el resorte está en reposo (x = 0) en el tiempo t = 0 segundos y se estira 
Figura 6.21 tanto como sea posible, hasta una longitud de 20 cm, antes de soltarse. Entonces 


0 = x(0) = c,cos0 + c sen0 = c 


x = 20 sen /Kt 


J 
T 
T, 


+ 2/K 


—20 E 


Figura 6.22 


NASA-JPL 


Figura 6.23 
El polo sur de Marte 
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de modo que x = c, sen VKt. Puesto que el valor máximo de la función seno es 1, debe 
tener c, = 20 (lo que ocurre por primera vez cuando t =7/2 VK), lo que produce la 
solución 


x = 20 sen VKt 


(Vea la figura 6.22.) 

Desde luego, esta es una solución idealizada, pues ignora cualquier forma de resis- 
tencia y predice que el resorte oscilará por siempre. Es posible tomar en cuenta efectos de 
amortiguamiento (como la fricción), pero este modelo simple sirvió para introducir una 
importante aplicación de las ecuaciones diferenciales y las técnicas que aquí se desarro- 


llaron. 


Ahora se dirigirá la atención hacia la clase de códigos más importantes y más amplia- 
mente usados: los códigos lineales. De hecho, muchos de los ejemplos ya analizados caen 
en esta categoría. La NASA usa de manera extensa los códigos lineales para transmitir 
imágenes del espacio exterior. En 1972, la nave espacial Mariner 9 usó un tipo de código 
lineal llamado código de Reed-Muller para transmitir imágenes en blanco y negro de 
Marte (figura 6.23). Luego, entre 1979 y 1981, el Voyager 1 y el Voyager 2 pudieron enviar 
de vuelta notables imágenes a color de Júpiter y Saturno (que se reproducen en blanco y 
negro en la figura 6.24) usando un código Golay, otro código lineal. 


Definición Un código lineal p-ario es un subespacio C de Z 


Como siempre, el principal interés es el caso p = 2, los códigos lineales binarios. 
Comprobar si un subconjunto C de Z} es un subespacio involucra demostrar que C sa- 
tisface las condiciones del Teorema 6.32. Dado que en Z5 los únicos escalares son 0 y 1, 
verificar que Ces cerrado para la multiplicación por un escalar sólo involucra demostrar 
que C contiene el vector cero. Todo lo que resta por comprobar es que C sea cerrado para 
la suma. 


NASA-JPL 
NASA-JPL 


Figura 6.24 


La mancha roja de Júpiter y los anillos de Saturno 
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> 
0 0 1 1 
0 0 1 1 j 1 E 
¿Ci = ola lar yC,=34|0|,|0|,| 0 | y son códigos lineales 
0 0 
0 1 0 1 
(binarios)? 


Solución Claramente, C, contiene el vector cero y es cerrado para la suma, de modo 
que es un código lineal. C, no es cerrado para la suma, pues no contiene 


1 1 0 
0|+|0|=]|0 
0 1 1 


Por tanto, C, no es lineal. | 


Para el resto de la sección, se omitirá el adjetivo “binario”, pues todos los códigos que 
se considerarán serán binarios. Si un código lineal C es un subespacio k-dimensional de 
Z5, entonces se dice que C es un código (n, k). 


Ejemplo 6.94 


> 
(a) El código C, del ejemplo 6.93 es un subespacio de Z$ y tiene dimensión 2, pues 


0 1 
0 Í 
Po 
1 0 


es una base para C}. (De hecho, C) tiene exactamente tres bases diferentes de dos ele- 
mentos. ¿Cuáles son las otras dos? Vea el ejercicio 31.) En consecuencia, C, es un código 
(4, 2). 

(b) El código H de Hamming (7, 4), que se introdujo en la sección 3.7, es un código li- 
neal (7, 4) (¡por fortuna!), en la nueva terminología. Es lineal porque tiene una matriz 
generadora G, de modo que sus vectores son todos los vectores de la forma Gx donde x 
está en Z$. Pero este es justo el espacio columna de la matriz G de 7 X 4 y por tanto es un 
subespacio de Z7. Puesto que las cuatro columnas de G son linealmente independientes 
(¿por qué?), forman una base para H. Por tanto, H es un código (7, 4). 


(c) Los códigos 


o] [1 ol P11 Pi7 Po 
C= 4 |0|] I y Cess oh E Oh 
oJ L1 oj Loj Lij L1 


son códigos duales. Es fácil ver que cada uno de ellos es un código lineal, que dim C = 1, 
y que dim C+= 2. (Compruebe esta afirmación.) Por tanto, C es un código (3, 1) y C+ es 
un código (3, 2). El hecho de que 3 = 1 + 2 no es un accidente, como muestra el si- 


guiente teorema. | 


Teorema 6.34 


Sea C un código lineal (n, k). 


a. El código dual C* es un código lineal (n, n — k). 
b. C contiene 2* vectores, y C* contiene 2" *vectores. 


Los códigos de Reed-Muller reci- 
ben su nombre en honor de los 
científicos de computación Irving 
S. Reed y David E. Muller, quienes 
en 1954 publicaron artículos, de 
manera independiente, acerca de 
esos códigos. 


Recuerde que la representación bi- 
naria, o de base dos, de un número 
surge de escribirlo como una suma 
de distintas potencias de dos. Si 
n=b,:24+--+b,-2+0b 
donde cada b; es 0 o 1, entonces 

en base dos n se representa como 

n = b;'**b,b,. Por ejemplo, 25 = 
16 +8 1 
0-2? +0:2 +1, de modo que la 
representación binaria de 25 es 
11001. 
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Demostración (a) Puesto que C es un código lineal (n, k), es un subespacio k-dimen- 

sional de Z}. Su dual C+ es el complemento ortogonal de C y por tanto también es un 

subespacio de Z}, por el Teorema 5.9(a). En consecuencia, C+ es un código lineal. 
Ahora es posible aplicar el Teorema 5.13 para demostrar que 


dimC+=n=dimC=n-=k 


(Nota: los Teoremas 5.9 y 5.13 son verdaderos si R” se sustituye con Z} . Éste es el caso 
para la mayoría de los resultados no geométricos acerca de la ortogonalidad.) Se con- 
cluye que C+ es un código(n, n — k) . 

(b) Sea [v,,... 
la forma 


, v,) una base para C. Entonces los vectores en C son todos los vectores de 


V= OV $ OV, + “o + Cova 


donde cada c; es 0 o 1. Por tanto, existen dos posibilidades para C, y, para cada una de 
ellas, dos posibilidades de c,, y así sucesivamente, lo que hace el número total de posibi- 
lidades para v 


2x2Xx-"x2=2* 
<A 


k veces 


Por tanto, C contiene exactamente 2* vectores. Al aplicar esta fórmula a su código dual 
(n,n — k), se ve que C+ tiene 2"! vectores. 
— 


Ahora se construye una de las familias más antiguas de códigos lineales, los códigos 
de Reed-Muller. Como se mencionó anteriormente, este es el tipo de código que usó la 
nave espacial Mariner 9 para transmitir imágenes de Marte. Con la finalidad de transmi- 
tirse, cada fotografía tiene que descomponerse en elementos de imágenes, o píxeles. Esto 
se hizo al suponer a la fotografía una rejilla de 700 X 832 píxeles y luego asignar a cada 
píxel uno de 64 tonos de gris, que varían de blanco (0) a negro (63). Puesto que 64 = 2%, 
puede usarse aritmética binaria para representar cada una de dichas sombras: blanco es 
000000 y negro es 111111. Entonces puede reescribir estos 64 números binarios como 
vectores en Z$ y codificarlos usando un código que corrige tantos errores como sea po- 
sible. El código que se eligió usar en el Mariner 9 pertenece a una gran familia de códi- 
gos que se definen más fácilmente de manera inductiva. 


Definición Los códigos de Reed-Muller R, (de primer orden) se definen induc- 


tivamente del modo siguiente: 


1. Paran =0,R, = Z, = (0, 1). 
2. Para n= 1, R, es el subespacio de Z3" cuya base consiste de todos los vectores de la 
forma 


a pr 
donde u es un vector base en R, O es el vector cero en Z? ,y 1 es el vector de nú- 
1 le 1 2 
meros 1 en Z% . 
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Para tener un sentido de lo que contienen estos vectores, use la definición para cons- 
truir R, y R,. Una base para R, = Z, es justo {1}, de modo que una base para R} es 


(BA) 


Por tanto, por cerradura bajo la suma, R, también debe contener a los vectores 


lbs lo + bij- k 


Es fácil comprobar que ningún otro vector puede obtenerse mediante la suma, de modo 


EM 


De igual modo, una base para R, es 


Rh ha 
=. o. oO 
Rh =. O O 


y, por cerradura bajo la suma, es fácil comprobar que los 8 = 2’ vectores en R, son 


R, = 


O O D a 
=. =. o o 
Rh > RR O 
O . =. O 
O PP O =e 
= = O = 
O O eme me 
— k Rh = 


Note que, en R}, todo vector código, excepto 0 y 1, tiene peso 1, y en R, todo vector 
código, excepto 0 y 1, tiene peso 2. Esta es una propiedad general de los códigos de Reed- 
Muller, y se prueba como parte del siguiente teorema. Pero primero note que el comple- 
mento de un vector x en Z; es el vector X que se obtiene al cambiar todos los ceros por 1 
y viceversa. Por ejemplo, 


=. O =e e 
O- oop 


Observe que x = x + 1, donde 1 es el vector que consiste por completo de números 1. 


Teorema 6.35 


Para n = 1, el código de Reed-Muller R, es un código lineal (2”, n + 1) en el que todo 
vector código, excepto 0 y 1, tiene peso 2”™!. 


Demostración Este teorema se demostrará por inducción sobre n. Para n = 1, ya se vio 
que R, = Z% es un código lineal (2, 2) = (2*, 1 + 1) en el que todo vector código, excepto 
0 y 1, tiene peso 1 = 2'*, Suponga que el resultado es verdadero para n = k; esto es, su- 
ponga que R, es un código lineal (2% k + 1) en el que todo vector código, excepto 0 y 1, 
tiene peso 2*”!, Ahora considere R44. 
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M ; i u 
Por construcción, R,,; tiene una base que consiste de vectores de la forma | | donde u 
u 
está en R, junto con el vector il Por la hipótesis de inducción, los vectores u, 0 y 1 
están en Z7; por tanto, los vectores base para R,,, están en Z2". Más aún, la dimensión 
: u , |0 
de R, es k + 1, de modo que existen k + 1 vectores de la forma yuno más, | |. Se 
u 


tiene que la dimensión de R,,; es k + 2 y por tanto R,,; es un código lineal (2'*1, k + 2). 
Para la aseveración final, note que los vectores en R, se obtienen como combina- 
ciones lineales de los vectores base y por tanto son de la forma 


u u 0 
v= al ] tt anl A | | 
u Uk+1 1 


donde {u}, . . . , U,,,) es una base para R, 0 y 1 están en Z. y cada ç; es 0 o 1. Suponga 
vÆ 0,1lyseau = cu, ++*** + C,,U,,,. (En consecuencia, u está en R,.) Si c,,, = 0, en- 
tonces u # 0, 1, de modo que, por la hipótesis de inducción, u tiene peso 2*”!. Pero 
entonces v tiene peso 2-2! = 2% Si c,,, = 1, entonces v tiene la forma 


A 


donde u está en R,. Puesto que 
w(u) = 2* — w(u) 
m—> (por qué?), se tiene 
w(v) = w(u) + w(u) = 2* 
como se requiere. Esto completa la inducción y se concluye que el teorema es verdadero 


para toda n = 1. 
— A 


Como se mencionó, el Mariner 9 requirió un código con 64 = 2* vectores. Por el 
Teorema 6.35, el código de Reed-Muller R, tiene dimensión 6 sobre Z,. Como verá en el si- 
guiente capítulo, también es capaz de detectar y corregir múltiples errores. Es por esto 
que la NASA usó el código de Reed-Muller para transmitir las fotografías del Mariner. 
Los ejercicios 35-38 exploran más aspectos de esta importante clase de códigos. 


Í Ejercicios 6.7 


ý > 
ES Ecuaciones diferenciales lineales homogéneas 5.f” —f' —f=0,f(0) =0,f(1) = 1 
En los ejercicios 1-12, encuentre la solución de la ecuación di- 6. g" — 2g =0,g(0) = 1,g(1) =0 
ferencial que satisfaga la condición de frontera dada. 7.y" —2y + y=0,y(0) = y(1) = 1 
1.y' =3y =0,y(1) =2 8.x" + 4x' + 4x = 0, x(0) = 1,x'(0) = 1 
2.x" +x=0,x(1) = 1 9.y” — ky = 0,k + 0,y(0) = y'(0) = 1 
3. y” — 7y' + 12y =0,y(0) = y(1) = 1 10. y” — 2ky" + ky =0,k + 0,y(0) =1,y(1) =0 


4.x" + x' — 12x=0,x(0) =0,x"(0) = 1 11. f” — 2f! + 5f=0,f(0) = 1,f(7r/4) = 0 
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12.h" — 4h' + 5h = 0, h(0) = 0,h'(0) = —1 

13. Una cepa de bacterias tiene una tasa de crecimiento que 
es proporcional al tamaño de la población. Inicialmente, 
existen 100 bacterias; después de 3 horas, existen 1600. 
(a) Si p(t) denota el número de bacterias después de t 

horas, encuentre una fórmula para p(t). 

(b) ¿Cuánto tarda la población en duplicarse? 
(c) ¿Cuándo la población llegará a un millón? 


cas 14, La tabla 6.2 muestra la población de Estados Unidos a 


intervalos de 10 años para los años 1900-2000. 

(a) Si supone un modelo de crecimiento exponencial, 
use los datos para 1900 y 1910 para encontrar una 
fórmula para p(t), la población en el año t. [Suge- 
rencia: seat = 0 en 1900 y t = 1 en 1910.] ¿Con 
cuánta precisión su fórmula calcula la población es- 
tadounidense en 2000? 

(b) Repita el inciso (a), pero use los datos para los años 
1970 y 1980 para determinar p(t). ¿Este plantea- 
miento ofrece una mejor aproximación para el año 
2000? 

(c) ¿Qué puede concluir acerca del crecimiento pobla- 
cional estadounidense? 


Tabla 6.2 
Población 
Año (en millones) 
1900 76 
1910 92 
1920 106 
1930 123 
1940 131 
1950 150 
1960 179 
1970 203 
1980 227 
1990 250 
2000 281 


Fuente: U.S. Bureau of the Census 


15. La vida media del radio 226 es de 1590 años. Suponga 
que comienza con una muestra de radio 226 cuya masa 
es de 50 mg. 

(a) Encuentre una fórmula para la masa m(t) que per- 
manece después de t años y use esta fórmula para 
predecir la masa restante después de 1000 años. 

(b) ¿Cuándo quedarán sólo 10 mg? 


16. La datación con radiocarbono es un método que usan los 
científicos para estimar la edad de objetos antiguos que 


alguna vez fueron materia viva, como hueso, piel, ma- 
dera o papel. Todos ellos contienen carbono, una pro- 
porción del cual es carbono 14, un isótopo radiactivo 
que se forma continuamente en la atmósfera superior. 
Puesto que los organismos vivos asimilan carbono ra- 
diactivo junto con otros átomos de carbono, la propor- 
ción entre las dos formas permanece constante. Sin em- 
bargo, cuando un organismo muere, el carbono 14 en 
sus células decae y ya no se reemplaza. El carbono 14 
tiene una vida media conocida de 5730 años, de modo 
que, al medir la concentración de carbono 14 en un ob- 
jeto, los científicos pueden determinar su edad aproxi- 
mada. 


Una de las aplicaciones más exitosas de la datación 
con radiocarbono fue la determinación de la edad del 
monumento Stonehenge en Inglaterra (figura 6.25). Se 
descubrió que las muestras tomadas de los restos de los 
postes de madera tenían una concentración de carbono 
14 que era 45% la que se encuentra en el material vivo. 
¿Cuál es la edad estimada de dichos postes? 
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Figura 6.25 


Stonehenge 


17. Una masa se une a un resorte, como en el ejemplo 6.92. 
En el tiempo £ = 0 segundos, el resorte se estira hasta 
una longitud de 10 cm por abajo de su posición en re- 
poso. El resorte se libera y se observa que su longitud 10 
segundos después es de 5 cm. Encuentre una fórmula 
para la longitud del resorte en el tiempo t segundos. 


18. Una masa de 50 g se une a un resorte, como en el ejem- 
plo 6.92. Si el periodo de oscilación es 10 segundos, en- 
cuentre la constante del resorte. 


19. Un péndulo consiste de una masa, llamada lenteja, que 
está fija en el extremo de un resorte de longitud L (vea la 
figura 6.26). Cuando la lenteja se aleja de su posición en 
reposo y se libera, se balancea de ida y vuelta. El tiempo 
que tarda el péndulo en ir desde su posición derecha 
más lejana hasta su posición izquierda más lejana y de 
vuelta a su siguiente posición derecha más lejana se 
llama periodo del péndulo. 


Sea 0 = 6(t) el ángulo del péndulo desde la vertical. 

Se puede demostrar que si no hay resistencia entonces, 

cuando 0 es pequeño, se satisface la ecuación diferencial 

or + £o=0 
L 

donde g es la constante de aceleración debida a la grave- 

dad, aproximadamente 9.7 m/s”. Suponga que L = 1 m 

y que el péndulo está en reposo (es decir, 0 = 0) en el 

tiempo t = 0 segundos. Entonces la lenteja se lleva a la 

derecha a un ángulo de 0, radianes y se libera. 

(a) Encuentre el periodo del péndulo. 

(b) ¿El periodo depende del ángulo 0, desde el que se li- 
bera el péndulo? Esta pregunta la planteó y respon- 
dió Galileo en 1638. [Galileo Galilei (1564-1642) es- 
tudió medicina en la Universidad de Pisa, pero su 
verdadero interés siempre fue la matemática. En 
1592 se designó a Galileo como profesor de mate- 
máticas en la Universidad de Padua, en Venecia, 
donde impartió principalmente geometría y astro- 
nomía. Fue el primero en usar un telescopio para 
observar las estrellas y los planetas y, al hacerlo, pro- 
dujo datos experimentales que apoyaban la visión 
copernicana de que los planetas daban vuelta alre- 
dedor del Sol y no de la Tierra. Por esto, Galileo 
compareció ante la Inquisición, se le puso en arresto 
domiciliario y se le prohibió publicar sus resultados. 
Mientras estaba en arresto domiciliario pudo escri- 
bir su investigación acerca de los objetos que caen y 
los péndulos. Sus notas se sacaron de contrabando 
de Italia y se publicaron en 1638 como Discursos 
sobre dos nuevas ciencias.| 


20. Demuestre que el conjunto solución S de la ecuación di- 


ferencial de segundo orden y” + ay” + by = 0 es un su- 
bespacio de F. 


21. Demuestre el Teorema 6.33(b). 


22. Demuestre que el*cos qt y e” sen qt son linealmente in- 


dependientes. 
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Sección 6.7 Aplicaciones 


¿Cuál de los códigos de los ejercicios 23-30 son códigos lineales? 


23. 


24. 


25. 


27. 


28. 


29. 


30. 


31. 


32. 


33. 


34. 


35. 
36. 


1 1 
e= (abah 
0 1 1 
(08) 
C= > 
0 1 
0 1 1 0 
C= 01,|0/[|[|1]]|1 
0 1 0 0 
0 1 0 0 
C= 0 > 0 > 1 > 0 
0 0 0 1 
0 0 0 0 
C= 0 > 1 > 1 > 0 
0 0 1 1 
0 1 0 1 0 1 
0 0 1 1 0 1 
C= > > > > 2 
0 1 0 0 1 1 
0 0 1 0 1 1 
El código de paridad par E, (vea el ejercicio 18 de la sec- 


ción 5.5.) 


El código de paridad impar O, que consiste de todos los 
vectores en Z} con peso impar. 


Encuentre las otras dos bases para el código C, en el 
ejemplo 6.94. 


(a) Si un código lineal (9, 4) tiene matriz generadora G 
y matriz de control de paridad P, ¿cuáles son las di- 
mensiones de G y P? 

(b) Repita el inciso (a) para un código lineal (n, k). 

Para un código lineal C, demuestre que (C+)* = C sin 

usar matrices. 


Si Ces un código lineal (n, k) que es autodual, demues- 
tre que n debe ser par. [Sugerencia: use el análogo en Z5 
del Teorema 5.13.] 

Escriba los vectores en el código R, de Reed-Muller. 
Defina inductivamente una familia de matrices del 
modo siguiente: G) = [1] y para n = 1, 


donde 0 es un vector cero y 1 es un vector que consiste 
por completo de números 1. 
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(a) Escriba G,, G, y G}. 
(b) Mediante inducción, demuestre que para todo 


n = 0, G, es una matriz generadora para el código 


R, de Reed-Muller. 
37. Encuentre una matriz de control de paridad para R,. 
38. Encuentre una matriz de control de paridad para R}. 


39. Demuestre que para un código lineal C, todos los vec- 


tores código tienen peso par o exactamente la mitad de 
ellos lo tienen. [Sugerencia: sea E el conjunto de vectores 
en C con peso par y O el conjunto de vectores en C con 
peso impar. Si O no está vacío, sea c, que está en O y con- 
sidere O' = [c, + e: e en Ej. Demuestre que O' = O.] 


Definiciones y conceptos clave 


base, 464 

base estándar, 465 516 
combinación lineal de vectores, 451 
composición de transformaciones 502 


matriz de una transformación lineal, 


nulidad de una transformación lineal, 


teorema fundamental de las matrices 
invertibles, 530 

transformación cero, 492 

transformación identidad, 492 


lineales, 495 

dimensión, 471 

espacio vectorial, 447 

generador de un conjunto de vectores, 
456 

inyectiva, 506 

isomorfismo, 511 

kernel de una transformación lineal, 
500 

matriz de cambio de base, 483 


1. Marque cada uno de los siguientes enunciados como 


verdadero o falso. 
(a) Si V = gen(v,..., 


v+w,u +w}. 


v,), entonces todo conjunto ge- 
nerador para V contiene al menos n vectores. 

(b) Si {u, v, w} es un conjunto de vectores linealmente 
independientes, entonces también lo es {u + v, 


rango de una transformación lineal, 
500 

rank de una transformación lineal, 
502 

sobreyectiva, 506 

subespacio, 452 

subespacio cero, 455 

subespacio trivial, 455 

teorema de la base, 471 

teorema del rank, 504 


transformación lineal, 490 

transformación lineal diagonalizable, 
527 

transformación lineal invertible, 496 

vector, 447 

vector coordenado, 467 

vectores linealmente dependientes, 
461, 464 

vectores linealmente independientes, 
461, 464 


(h) Si T : M,, > P, es una transformación lineal y nuli- 


dad(T) = 4, entonces T es sobreyectiva. 


(i) El espacio vectorial V = {p(x) en P, : p(1) = 0} es 
isomórfico a W,. 

j) SiI: V— V es la transformación identidad, enton- 
ces la matriz [1] ¿,_g es la matriz identidad para cua- 


lesquiera bases B y C de V. 


(c) M,, tiene una base que consiste de matrices inverti- 


bles. 


(d) M,, tiene una base que consiste de matrices cuya 


traza es cero. 


2. V= RW 


(e) La transformación T : R” — R definida por 


T(x) = ||x|| es una transformación lineal. 

(£) Si T: V> W es una transformación lineal y 
dim V 4% dim W, entonces T no puede ser 
tanto inyectiva como sobreyectiva. 


(g) Si T: V> W es una transformación lineal y 


ker(T) = V, entonces W = (0). 


En las preguntas 2-5, determine si W es un subespacio de V. 


(e 


3. V = Mp, W= il 


4. V = P, W = {p(x) en P; : x°p(1/x) = p(x)} 


5. V = F, W = {fen F: f(x + m) = f(x) para toda x} 
6. Determine si {1, cos 2x, 3sen”x) es linealmente depen- 
diente o independiente. 


7. Sean A y B matrices de n X n distintas de cero tales que 
A es simétrica y B es antisimétrica. Pruebe que {A, B} es 
linealmente independiente. 


En las preguntas 8 y 9, encuentre una base para W y enuncie 
la dimensión de W. 


o Perd 
c d 


9. W = {p(x) en P; : p(—x) = p(x)} 


10. Encuentre las matrices de cambio de base Peg y Pgec 
con respecto a las bases B = {1,1 +x, 1 +x + x°} y 
C=([1+xx+x?,1 + x} de P. 


En las preguntas 11-13, determine si T es una transformación 
lineal. 


11. T: R? — R definida mediante T(x) = yx"y, donde 
1 
a A 
12. T : Ma, > Ms, definida mediante T(A) = ATA 
13. T : P, —> P, definida mediante T(p(x)) = p(2x — 1) 


14. Si T : P, —> M, es una transformación lineal tal que 


T(1) = la shra +x)= f y 


15. 


16. 


17. 


18. 


19. 


20. 


Repaso del capítulo 551 


a [o = 
T(1 +x +x) = a , encuentre T(5 — 3x + 


Encuentre la nulidad de la transformación lineal 
T: Mi, —>R definida mediante T(A) = tr(4). 


Sea W el espacio vectorial de las matrices triangulares 

superiores de 2 X 2. 

(a) Encuentre una transformación lineal T : Ma) > Mb», 
tal que ker(T) = W. 

(b) Encuentre una transformación lineal T : Ma, > M», 
tal que rango(T) = W. 

Encuentre la matriz [T] y de la transformación lineal 

T en la pregunta 14 con respecto a las bases estándar 

B = [1,x,x* de P, y C = {Ep Ei» Ezp Esp) de M32. 

Sea S = {v;, ... v,) un conjunto de vectores en un es- 

pacio vectorial V con la propiedad de que todo vector en 

V puede escribirse como una combinación lineal de 

Vi»... Y, en exactamente una forma. Pruebe que S es 

una base para V. 

SiT:U—>VyS: V—> W son transformaciones linea- 

les tales que rango(T') C ker(S), ¿qué puede deducir 

acerca de S o T? 

Sea T: V> V una transformación lineal, y sea 

{Vi ... > Vn} una base para V tal que (T(v,),..., T(v,)) 

también es una base para V. Pruebe que T es invertible. 


Una línea recta puede ser la 
distancia más corta entre dos 
puntos, pero de ninguna forma 
es la más interesante. 
—Doctor Who en “The Time 
Monster” de Robert Sloman 
BBC, 1972 
Aunque esto pueda parecer 
paradójico, toda ciencia exacta 
está dominada por la idea de la 
aproximación. 
—Bertrand Russell 
en W. H. Auden y L. 
Kronnenberger, eds., 
The Viking Book of Aphorisms, 
Viking, 1962, p. 263 


Figura 7.1 


Distancia de taxi 


Distancia y 
aproximación 


1.0 


Se vive en un mundo euclidiano tridimensional y, por tanto, los conceptos de la geometría 
euclidiana gobiernan la forma en que se ve el mundo. En particular, imagine que detiene a 
la gente en la calle y que les pide llenar el espacio en blanco de la siguiente oración: “la dis- 
tancia más corta entre dos puntos es ”, Con mucha seguridad responderán “una 
línea recta”. Sin embargo, existen otras nociones de distancia igualmente sensibles e intui- 
tivas. Al permitirse pensar en “distancia” en una forma más flexible, abrirá la puerta a la 
posibilidad de tener una “distancia” entre polinomios, funciones, matrices y muchos otros 
objetos que surgen en el álgebra lineal. 

En esta sección descubrirá un tipo de “distancia” que es tan real como la distancia en 
línea recta a que está acostumbrado en la geometría euclidiana (la que es consecuencia del 
teorema de Pitágoras). Como verá, este nuevo tipo de “distancia” todavía se comporta en 
algunas formas familiares. 

Suponga que está de pie en una intersección en una ciudad y trata de llegar a un res- 
taurante en otra intersección. Si le pregunta a alguien qué tan lejos está el restaurante, es 
improbable que esa persona mida la distancia “a vuelo de pájaro” (esto es: usando la ver- 
sión euclidiana de distancia). En vez de ello, la respuesta será algo como “está a cinco cua- 
dras”. Dado que esta es la forma como los conductores de taxi miden la distancia, a esta no- 
ción de “distancia” se le referirá como distancia de taxi. 

La figura 7.1 muestra un ejemplo de distancia de taxi. La ruta más corta de A a B re- 
quiere recorrer los lados de cinco cuadras de la ciudad. Note que, aunque hay más de una 
ruta de A a B, todas las rutas más cortas requieren tres movimientos horizontales y dos ver- 
ticales, donde un “movimiento” corresponde al lado de una cuadra de la ciudad. (¿Cuán- 
tas rutas más cortas hay de A a B?) Por tanto, la distancia de taxi de Aa Bes 5. 

Al idealizar esta situación, se supondrá que todas las cuadras son cuadrados unitarios, 
y se usará la notación d, (A, B) para la distancia de taxi de A a B. 


Introducción: geometría de taxi 


Problema 1 Encuentre la distancia de taxi entre los siguientes pares de puntos: 
(a) (1,2): y (5,5) (b) (2,4) y (3,-2) 
(c) (0,0) y (74,3) (da) (22,3) y (1,3) 
(e) (LH: y3 (546) y (31,15) 
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Problema 2 ¿Cuál de las siguientes es la fórmula correcta para la distancia de taxi 
d,(A, B) entre A = (a,, a,) y B = (b, b,)? 
(a) dí(A, B) = (a, — b,) + (a, — b,) 
(b) d,(4, B) = (ay l:l) + (a, ba) 
(c) dí(4, B) = a, e by ES a, = b, 


Es posible definir la norma de taxi de un vector v como 
Ivl: = dv, 0) 


Problema 3 Encuentre ||v||, para los siguientes vectores: 


Problema 4 Demuestre que el Teorema 1.3 es verdadero para la norma de taxi. 
Problema 3 Verifique la desigualdad del triángulo (Teorema 1.5) usando la norma 
de taxi y los siguientes pares de vectores: 


09 [ro] 05) 


Problema 6 Demuestre que la desigualdad del triángulo es verdadera, en general, 
para la norma de taxi. 


En geometría euclidiana puede definirse una circunferencia de radio r, con centro en 
el origen, como el conjunto de todos los x tales que [|x| = r. Por analogía, puede definir 
una circunferencia de taxi de radio r, con centro en el origen, como el conjunto de todos 
los x tales que |x|]; = r. 


Problema 7 Dibuje circunferencias de taxi con centro en el origen y los siguientes ra- 
dios: 


(a) r=3 (b) r=4 (c) r=1 
Problema 8 En geometría euclidiana, el valor de n es la mitad de la circunferencia de 


un círculo unitario (un círculo de radio 1). Defina la pi de taxi como el número 7, que 
es la mitad de la circunferencia de un círculo de taxi unitario. ¿Cuál es el valor de 75? 


En geometría euclidiana, el bisector perpendicular de un segmento de recta AB 
puede definirse como el conjunto de todos los puntos que son equidistantes a A y B. Si 
usa la distancia de taxi en lugar de la distancia euclidiana, es razonable preguntar cómo 
se ve ahora el bisector perpendicular de un segmento de recta. Para ser precisos: el bi- 
sector perpendicular de taxi de AB es el conjunto de todos los puntos X tales que 


d (XA) = d,(X B) 


Problema 9 Dibuje el bisector perpendicular de taxi de AB para los siguientes pares 
de puntos: 


(a) A=(2,1)B=(4,1) (b) A = (=1,3), B = (-1, —2) 
(c) A=(1,1),B= (5,3) (d) A= (1, 1), B = (5,5) 


Como ilustra cada uno de estos problemas, la geometría de taxi comparte algunas 
propiedades con la geometría euclidiana, pero también difiere en algunas formas impre- 
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sionantes. En este capítulo encontrará muchos otros tipos de distancias y normas, cada 
una de las cuales es útil por cuenta propia. Se intentará descubrir qué tienen en común 
y usará dichas propiedades comunes en su beneficio. También explorará diversos pro- 
blemas de aproximación en los que la noción de “distancia” tiene un papel importante. 


Espacios con producto interno 


En el capítulo 1 se definió el producto punto u - v de los vectores u y v en R”, y a lo largo 
del libro se ha usado repetidamente. En esta sección se usarán las propiedades del pro- 
ducto punto como un medio para definir la noción general de un producto interno. En la 
siguiente sección se demostrará que los productos internos pueden usarse para definir 
análogos de “longitud” y “distancia” en espacios vectoriales distintos a R”. 

La siguiente definición es el punto de partida; se basa en las propiedades del pro- 
ducto punto demostradas en el Teorema 1.2. 


Definición Un producto interno sobre un espacio vectorial V es una operación 
que asigna a cada par de vectores u y v en V un número real (u, v} tal que las siguientes 
propiedades se cumplen para todos los vectores u, v y w en V y todos los escalares c: 


1. (u, v) = (v, u) 

2. (u, v + w) = (u, v) + (u, w) 

3. (cu, v) = clu, v) 

4. (u, u) = 0 y (u, u) = 0 si y sólo si u = 0 


Un espacio vectorial con un producto interno se llama espacio con producto interno. 


Comentario Técnicamente, esta definición especifica un espacio con producto interno 
real, pues supone que V es un espacio vectorial real y que el producto interno de dos vec- 
tores es un número real. También existen espacios con producto interno complejos, pero su 
definición es un tanto diferente. (Vea la Exploración: “Vectores y matrices con entradas 
complejas” al final de esta sección.) 


Ejemplo 7.1 


> 


R” es un espacio con producto interno con (u, v) = u + v. Las propiedades (1) a (4) se veri- 


ficaron como el Teorema 1.2. 


El producto punto no es el único producto interno que puede definirse en R”. 


Ejemplo 7.2 


_|4% |Y 2 
Sean u = yv= dos vectores en R^. Demuestre que 
u v2 


(u, v) = 2u,v, + 3u 


define un producto interno. 
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Solución Se deben verificar las propiedades (1) a (4). La propiedad (1) se cumple por- 
que 


(u, v) = 24,4, + 3u, = 2vu, + 3v = (v, u) 


w 


A continuación, sea w = | | Se comprueba que 


w2 
lu, v + w = 24 (v, + wi) + 3u (v, + w) 

= 2u, + 24,w, + 3u,v, + 3uw, 

= (24,1, + 3u) + (Quw, + 3uw2) 
= (u, v) + lu, w) 


lo que prueba la propiedad (2). 
Si c es un escalar, entonces 


(cu, v) = 2(cu,)v, + 3(cu,)v, 


c(Quyv, + 3u,v,) 


= clu, v) 


lo que verifica la propiedad (3). 
Finalmente, 


(u, u) = 244, + 3uyu, = 247 + 343 =0 


y es claro que (u, u) = 2u? + 3u% = 0 si y sólo si u, = u, = 0 (esto es, si y sólo si u = 0). 
Esto verifica la propiedad (4) y completa la demostración de que (u, v), como se definió, 


es un producto interno. 


El ejemplo 7.2 puede generalizarse para demostrar que si w}, . . . , w, son escalares po- 
sitivos y 
u Vi 
u= y Mi : 
u v 


son vectores en R”, entonces 


(u, v) = wuy ar a00 a A (1) 


non 


define un producto interno sobre R”, llamado producto punto ponderado. Si alguno de 
los pesos w, es negativo o cero, entonces la ecuación (1) no define un producto interno. 
(Vea los ejercicios 13 y 14.) 

Recuerde que el producto punto puede expresarse como u - v = uv. Observe que es 
posible escribir el producto punto ponderado en la ecuación (1) como 


(u, v) = u"Wv 
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donde W es la matriz diagonal den X n 


wi ... 0 


= 
Í 


n 


Fl siguiente ejemplo generaliza aún más este tipo de producto interno. 


Ejemplo 7.3 


> 
Sea A una matriz simétrica definida positiva de n X n (vea la sección 5.5) y sean u y v 
vectores en R”. Demuestre que 


(u, v) = u Av 


define un producto interno. 


Solución Compruebe que 


(u, v) = u/Av = u- Av = Av- u 
= A'v-u = (v'A)" -u = vAu = (v,u) 
Además, 


(u, v + w) = uA(v + w) = uAv + u'Aw = (u, v) + (u, w) 


(cu, v) = (cu)"Av = c(u"Av) = clu, v) 


Finalmente, puesto que A es definida positiva, (u, u) = u”Au > 0 para toda u % 0, de 
modo que (u, u) = u”Au = 0, si y sólo si u = 0. Esto establece la última propiedad. 


sl 


4 -2 


Para ilustrar el ejemplo 7.3, sea A = | -> a! Entonces 


7 4 =2|| v 
(u, v) = u'Av = [u w] Lj = duvi — 24,v, — 2i + 7u 
2 
La matriz A es definida positiva, por el Teorema 5.24, pues sus eigenvalores son 3 y 8. Por 

tanto, (u, v) define un producto interno sobre R°. 


Ahora se definirán algunos productos internos sobre espacios vectoriales distintos 
a R”. 


Ejemplo 7.4 


En P,, sean p(x) = a, + a,x + a,x? y q(x) = b, + b,x + b,x’. Demuestre que 
(p(x), a(x)) = aobo + ayb, + ab, 
define un producto interno sobre P,. (Por ejemplo, si p(x) = 1 — 5x + 3x y q(x) = 


6 + 2x — x’, entonces (p(x), q(x)) = 1-6 + (—5) -2 + 3- (—1) = —7.) 


Solución Puesto que P, es isomórfico a RŽ, sólo es necesario demostrar que el pro- 
ducto punto en R? es un producto interno, lo que ya se estableció. | 
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| 5 


Ejemplo 1.5 Sean fy g que están en € [a, b] , el espacio vectorial de todas las funciones continuas sobre 
el intervalo cerrado [a, b]. Demuestre que 


b 
Ge) = | SOLA de 
define un producto interno sobre € [a, b]. 
Solución Se tiene 


b 


(a = | ros a | soso a (61) 


a a 


Además, si h está en € [a, b], entonces 


(at m= | FGH) + 1) dx 


a 


= (48) + fh) 

Si c es un escalar, entonces 
cf(x)g(x) dx 
f(x)g(x) dx 


8) 


f 
: 


(fg) = 
= cf, 


b 
Finalmente, ( f, f} = | (f60))? dx = 0, y de un teorema del cálculo se tiene que, puesto 


b 
que fes continua, ( f, f) = | (f(x)? dx = 0 si y sólo si fes la función cero. Por tanto, ( f, g) 


a 


es un producto interno sobre € [a, b]. | 


El ejemplo 7.5 también define un producto interno sobre cualquier subespacio de 
€ [a, b]. Por ejemplo, podría restringir la atención a los polinomios definidos en el inter- 
valo [a, b]. Suponga que considera P[0, 1], el espacio vectorial de todos los polinomios 
sobre el intervalo [0, 1]. Entonces, al usar el producto interno del ejemplo 7.5, se tiene 


1 1 
(12,1+:%= | xU(1 + x) dx = | (x? + x°) dx 
0 0 
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Propiedades de los productos internos 


El siguiente teorema resume algunas propiedades adicionales que son consecuencia de la 
definición de producto interno. 


Teorema 7.1 


Ejemplo 7.6 


Sean u, v y w vectores en un espacio con producto interno V y sea c un escalar. 


a. (u + v, w) = (u, w) + (v, w) 
b. (u, cv) = clu, v) 
c. (u, 0) = (0, v) = 0 


Demostración Se demuestra la propiedad (a) y las demostraciones de las propiedades 
(b) y (c) se dejan como los ejercicios 23 y 24. Con referencia a la definición del producto 
interno, se tiene 


(u + v, w) = (w,u + v) por (1) 
= (w, u) + (ww) por(2) 


= (u, w) + (v, w) por (1) 


Longitud, distancia y ortogonalidad 


En un espacio con producto interno puede definir la longitud de un vector, la distancia 
entre vectores y los vectores ortogonales, como se hizo en la sección 1.2. Simplemente 
tiene que sustituir cada uso del producto punto u v por el más general producto interno 
(u, v). 


Definición Sean u y v vectores en un espacio con producto interno V. 


1. La longitud (o norma) de v es|v| = V/v, v). 
2. La distancia entre u y ves d(u, v) =|lu — vl]. 
3. u y v son ortogonales si (u, v) = 0. 


Note que ||v|| siempre está definido, pues (v, v) = 0 por la definición de producto in- 
terno, de modo que puede sacar la raíz cuadrada de esta cantidad no negativa. Como en 
R” un vector de longitud 1 se llama vector unitario. La esfera unitaria en V es el con- 
junto S de todos los vectores unitarios en V. 


Considere el producto interno sobre 6 [0, 1] dado en el ejemplo 7.5. Si f(x) = xy g(x) = 
3x — 2, encuentre 


(a) Ifl (b) df 8) (c) (f8) 


Solución (a) Se encuentra que 


N= | Peds | a] a 
de modo que |f] = WEN) = 1/3. 
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(b) Dado que d(f g) = |f- s| = V= 8f- g) y 
f(x) — g(x) = x — (3x — 2) = 2 — 2x = 2(1 — x) 


setiene  (f—gf- g)= | (f(x) — g(x)? dx = | 4(1 — 2x + x°) dx 


So 4 
= alx xX + | = 
3ļloọo 3 
Al combinar estos hechos, se ve que d(f g) = V4/3 = 2/ V3. 
(c) Calcule 


(fg) = | row dx = ES - 2) dx = [os — 2x) dx = [x° — 1%] = 0 


Por tanto, f y g son ortogonales. | 


Es importante recordar que la “distancia” entre f y g en el ejemplo 7.6 no se refiere a 
alguna medida relacionada con las gráficas de dichas funciones. Tampoco el hecho de 
que f y g sean ortogonales significa que sus gráficas se intersequen en ángulos rectos. 
Simplemente se aplica la definición de un producto interno particular. Sin embargo, al 
hacerlo, uno debe guiarse por las correspondientes nociones en R? y R?, donde el pro- 
ducto interno es el producto punto. La geometría del espacio euclidiano todavía puede 
guiarlo aquí, aun cuando no pueda visualizar las cosas de la misma forma. 


> 


Ejemplo 7.7 


Con el producto interno sobre R? definido en el ejemplo 7.2, dibuje una gráfica de la es- 
fera (círculo) unitaria. 


A : x ; . 
Solución Six = | | entonces (x, x) = 2x? + 3y?. Puesto que la esfera (circunferencia) 
y 


unitaria consiste de todos los x tales que ||x|| = 1, se tiene 


l=|x] = Wax = V2x7 + 3y o 2x?+3y?=1 


Esta es la ecuación de una elipse y su gráfica se muestra en la figura 7.2. 


Figura 7.2 
Una circunferencia unitaria que es una elipse 


Capítulo 7 Distancia y aproximación 


En la siguiente sección y en los ejercicios se discutirán las propiedades de longitud, 
distancia y ortogonalidad. Un resultado que se necesitará en esta sección es la versión ge- 
neralizada del teorema de Pitágoras, que amplía el Teorema 1.6. 


Teorema 7.2 


Teorema de Pitágoras 


Sean u y v vectores en un espacio con producto interno V. Entonces u y v son orto- 
Y 
gonales si y sólo si 


lu + vl? = Jul? + Ivl? 


Demostración Como se le pedirá demostrar en el ejercicio 32, se tiene 
|u + v|? = (u + v, u + v = Jul? + 2u, v) + [v]? 


Se concluye inmediatamente que |u + v|? = Jul]? + |v]? si y sólo si (u, v) = 0. 
— 


Proyecciones ortogonales y el proceso de Gram-Schmidt 


En el capítulo 5 se discutió la ortogonalidad en R”. La mayor parte de este material se ge- 
neraliza bastante bien a espacios con producto interno en general. Por ejemplo, un con- 
junto ortogonal de vectores en un espacio con producto interno V es un conjunto 
{Vp - . -> Vg} de vectores de V tales que (v, v) = 0 siempre que v; + v, Entonces un con- 
junto ortonormal de vectores es un conjunto ortogonal de vectores unitarios. Una base 
ortogonal para un subespacio W de V es justo una base para W que es un conjunto or- 
togonal; de igual modo, una base ortonormal para un subespacio W de V es una base 
para W que es un conjunto ortonormal. 

En R’, el proceso de Gram-Schmidt (Teorema 5.15) muestra que todo subespacio 
tiene una base ortogonal. Es posible imitar la construcción del proceso de Gram-Sch- 
midt para demostrar que todo subespacio con dimensión finita de un espacio con pro- 
ducto interno tiene una base ortogonal, todo lo que se requiere es sustituir el producto 
punto por el más general producto interno. Este planteamiento se ilustrará con un ejem- 
plo. (Compare estos pasos con los dados en el ejemplo 5.13.) 


Ejemplo 7.8 


Construya una base ortogonal para P, con respecto al producto interno 
1 
He) = | 104 d 
= 


al aplicar el proceso de Gram-Schmidt a la base {1, x, x°}. 


Solución Sean x, = 1, x, = xy xX, = x?. Comience por establecer v, = x, = 1. A conti- 
LL 2 y 3 1 1 
nuación calcule 


1 i 1 ya Ti 
Vov) | dx J 2 y (bx) = | x dx = =] =0 


i =j 24 


Adrien Marie Legendre (1752-1833) 
fue un matemático francés que 
trabajó en astronomía, teoría de 
números y funciones elípticas. 
Estuvo involucrado en varias 
discusiones acaloradas con Gauss. 
Legendre proporcionó el primer 
enunciado publicado de la ley de 
reciprocidad cuadrática en teoría de 
números en 1765. Sin embargo, 
Gauss ofreció la primera 
demostración rigurosa de este 
resultado en 1801 y reclamó el 
crédito por el resultado, lo que 
generó la comprensible irá de 
Legendre. Luego, en 1806, Legendre 
ofreció la primera aplicación 
publicada del método de mínimos 
cuadrados en un libro acerca de las 
órbitas de los cometas. Gauss 
publicó acerca del mismo tema en 
1809, pero afirmó que él usaba el 
método desde 1795, lo que enfureció 
de nuevo a Legendre. 


perpy(v) 


proy y(v) 
WwW 


Figura 7.3 
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Por tanto, 


Entonces 


(Va, al == x2 
(Vo V2) ? 


(v, > X3) 


(Vo Vi) 


v=% 
Se tiene que {v}, V, V3} es una base ortogonal para P, en el intervalo [—1, 1]. Los poli- 
nomios 

LL ox xi 
son los primeros tres polinomios de Legendre. Si cada uno de dichos polinomios se di- 


viden por sus longitudes relativas al mismo producto interno, se obtienen polinomios 
normalizados de Legendre (vea el ejercicio 41). 


Tal como se hizo en la sección 5.2, es posible definir la proyección ortogonal 
proyw (v) de un vector v sobre un subespacio W de un espacio con producto interno. Si 


fu, - - - , U} es una base ortogonal para W, entonces 
(up v) (up v) 
proyw(v) = u 00 qe u 
(usu) (up w) 


Entonces el componente de v ortogonal a W es el vector 


perpw(v) = v — proyw(v) 


Como en el teorema de descomposición ortogonal (Teorema 5.11), proy,y(v) y perp y (v) 
son ortogonales (vea el ejercicio 43) y, por tanto, esquemáticamente, se tiene la situación 
que se ilustra en la figura 7.3. 

Dichas fórmulas se usarán en las secciones 7.3 y 7.5 cuando se consideren problemas 
de aproximación, en particular, el problema de cómo aproximar mejor una función 
dada mediante funciones “amigables”. En consecuencia, cualquier ejemplo se diferirá 
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hasta entonces, cuando tendrá más sentido. El uso inmediato de la proyección ortogonal 
será demostrar una desigualdad que se encontró por primera vez en el capítulo 1. 


Las desigualdades de Cauchy-Schwarz y del triángulo 


Las pruebas de las identidades y desigualdades que involucran el producto punto en R” 
se adaptan fácilmente para ofrecer resultados correspondientes en los espacios generales 
con producto interno. Algunas de ellas se proporcionan en los ejercicios 31-36. En la sec- 
ción 1.2 se enunció sin demostración la desigualdad de Cauchy-Schwarz, que es impor- 
tante en muchas ramas de la matemática. Ahora se dará una demostración de este resul- 
tado. 


Teorema 7.3 


Esta desigualdad la descubrieron 
varios matemáticos en contextos 
diferentes. No es de sorprender 
que el nombre del prolífico 
Cauchy se vincule con ella. El 
segundo nombre asociado con este 
resultado es el de Karl Herman 
Amandus Schwarz (1843-1921), 
un matemático alemán que 
impartió clases en la Universidad 
de Berlín. Su versión de la 
desigualdad que lleva su nombre 
se publicó en 1885 en un ensayo 
que usó ecuaciones integrales para 
estudiar superficies de área 
mínima. Un tercer nombre que 
también se asocia con este 
importante resultado es el del 
matemático ruso Viktor 
Yakovlevitch Bunyakovsky (1804- 
1889). Bunyakovsky publicó la 
desigualdad en 1859, un cuarto de 
siglo antes que el trabajo de 
Schwarz acerca del mismo tema. 
Por tanto, es más adecuado 
referirse al resultado como la 
desigualdad de Cauchy- 
Bunyakovsky-Schwarz. 


La desigualdad de Cauchy-Schwarz 
Sean u y v vectores en un espacio con producto interno V. Entonces 
(u, v) = Jal lv] 


donde la igualdad se cumple si y sólo si u y v son múltiplos escalares uno de otro. 


Demostración Siu = 0, entonces la desigualdad en realidad es una igualdad, pues 


Ko, v) = 0 = Jioll 


Si u + 0, entonces sea W el subespacio de V generado por u. Puesto que proy,,(v) = 


u, v 
l a y perpwy V = v — proy,y(v) son ortogonales, es posible aplicar el 


(u, u) 


Teorema de Pitágoras para obtener 


|? 


Ivl? = |proyw(v) + (v = proyw(v))|? = |proyw(v) + perpw(v) 
= ||proyw(v)|? + ||perpw(v) 


(2) 


[P 
Se tiene que ||proyw(v)||? = [vl?. Ahora 
(u, v) (u,v ) ( lu, v) ) 
2 = — — 
| proyw(v) | e u) u, (u, u) u (u, u) (u, u) 
así que se tiene 


(u, vý 


lul? 


(wv _ (w vý 


(wu) [ul 


< lv? o, de manera equivalente, — (u, v? < [jul llv]? 


Al sacar raíces cuadradas, se obtiene |(u, v)] = [jul] lvl]. 
Claramente, esta última desigualdad es una igualdad si y sólo si |poy,,(v)|?= |v|?. Por 
la ecuación (2) esto es verdadero si y sólo si perpw (v) = 0 o, de manera equivalente, 
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Si esto es así, entonces v es un múltiplo escalar de u. Por el contrario, si v = cu, entonces 
(u, cu) clu, u) 
perpy(v) = v — proyy(v) = cu u=cu u=0 


(u, u) (u, u) 


así que la igualdad se mantiene en la desigualdad de Cauchy-Schwarz. — 


Para una demostración alternativa de esta desigualdad, vea el ejercicio 44. En la Ex- 
ploración: “Desigualdades geométricas y problemas de optimización”, que sigue a esta 
sección, se investigarán algunas interesantes consecuencias de la desigualdad de Cauchy- 
Schwarz. Por el momento, se le usará para demostrar una versión generalizada de la de- 
sigualdad del triángulo (Teorema 1.5). 


Teorema 7.4 La desigualdad del triángulo 


Sean u y v vectores en un espacio con producto interno V. Entonces 


la + vi = ul] + vl 


Demostración A partir de la igualdad que se le pedirá demostrar en el ejercicio 32, se 


tiene 
[u + vi? = ul? + 2u, v) + Ivl? 
= lal? + 2[(u, v)] + Ivl? 
<= lu? + 2/ul Iv] + |v]? por Cauchy-Schwarz 
= (Jul + vi)? 
Al sacar raíces cuadradas se obtiene el resultado. _— 3 
| Ejercicios 7.1 a 
ROE 2 3 5. (p(x), q(x)) es el producto interno del ejemplo 7.4. 
En los ejercicios 1 y 2, sean u = y v= ] R . . 
=1 4 6. (p(x), q(x)) es el producto interno del ejemplo 7.5 sobre 


. . el espacio vectorial, 4, [0, 1]. 
1. (u, v) es el producto interno del ejemplo 7.2. Calcule 
(a) (u,v) (b) Jull (c) d(u, v) 7. En el ejercicio 5, encuentre un vector distinto de cero 


ortogonal a p(x). 


2. (u, v) es el producto interno del ejemplo 7.3 con EN 
4 =ð &^ 8. En el ejercicio 6, encuentre un vector distinto de cero 
A= | -2 al Calcule ortogonal a p(x). 
A MN _ E 
1% En los ejercicios 9 y 10, sean f(x) = sen x y g(x) = sen x + 
(a) (uv) (b) ul (ek alay cos x en el espacio vectorial €[0, 277] con el producto interno 
3. En el ejercicio 1, encuentre un vector distinto de cero definido por el ejemplo 7.5. 


ortogonal a u. 9. Calcule 


4. En el ejercicio 2, encuentre un vector distinto de cero 


ortogonal a u. (a) 8) (b) IfI (c) d(f g) 


10. Encuentre un vector distinto de cero ortogonal a f. 
En los ejercicios 5 y 6, sean p(x) = 2 — 3x + x? y q(x) = 
1 — 3x?. Calcule 


(a) (pto, q() ©) px)! (c) dp), q(x)) (p(x), a) = plaja(a) + p(bja(b) + ploja(c) 


11. Sean a, b y c números reales distintos. Demuestre que 
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define un producto interno sobre P,. [Sugerencia: nece- 
sitará el hecho de que un polinomio de grado n tiene 
como máximo n ceros. Vea el Apéndice D.] 


12. Repita el ejercicio 5 usando el producto interno del ejer- 
cicio 11 cona=0,b=1,c=2. 


En los ejercicios 13-18, determine cuál de los cuatro axiomas 
de producto interno no se cumple. Proporcione un ejemplo es- 
pecífico en cada caso. 


v i 

13. Seanu = |” y v= | ' en R. Defina (u, v) = uv. 
LU) v2 
| u vı m2 

14. Sean u = | yv= | | en R”. Defina (u, v) = uv — 

uz va 
UVa. 

[u v 

15. Sean u = i yv= | ] en R°. Defina 
LU Va 


(u, V) = uv + uyv. 
16. En P,, defina (p(x), q(x)) = p(0)q(0). 


17. En P, defina (p(x), q(x)) = p(Dq(1). 
18. En M)», defina (A, B) = det(AB). 


En los ejercicios 19 y 20, (u, v) grafique un producto interno 


v 
sobre R?, donde u = [e yv= | ll Encuentre una 
v 


uz 2 
matriz simétrica A tal que (u, v) = u”Av. 
19. (u, v) = 44V, + uv + uv, + 4u 


20. (u, v) = uv, + 24,1, + 2u,v, + 5u 


En los ejercicios 21 y 22, bosqueje el círculo unitario en R? 

para el producto interno dado, donde u = ll yv= ja! 
2 2 

21. (u, v) = uv, + uv 

22. (u, v) = 4u,v, + uv, + uv, + 4u 

23. Demuestre el Teorema 7.1 (b). 

24. Demuestre el Teorema 7.1(c). 


En los ejercicios 25-29, suponga que u, v y w son vectores en 
un espacio con producto interno tal que 


(u, v) = 1, (vw) =0 
ful = 1, [w] = 2 


(u, w) = 5, 


Ivi = v3, 


Evalúe las expresiones en los ejercicios 25-28. 
25. (u + w, v — w) 

26. (2v — w, 3u + 2w) 

27. [lu + vl| 


28. | 2u — 3v + wl|| 


29. Demuestre que u + v = w. [Sugerencia: ¿cómo puede 
usar las propiedades del producto interno para verificar 
queu + v — w= 07] 

30. Demuestre que en un espacio con producto interno, no 
puede haber vectores unitarios u y v con (u, v) < —1. 


En los ejercicios 31-36, (u, v} es un producto interno. En los ejer- 
cicios 31-34, demuestre que el enunciado dado es una identidad. 


31. (u + v, u — v) = |ual? — Ivl? 

32. |u + v? = Jul? + 2u v) + ivl? 

33. ul? + v? = zlu + vi? + zlu — vl? 

34. (u, v) = llu + vl? — ilu — vl? 

35. Demuestre que |u + v|| = [hu — vl| si y sólo si u y v son 
ortogonales. 


36. Demuestre que d(u, v) = Y Jul? + ||vl|? si y sólo si u y 


v son ortogonales. 


En los ejercicios 37-40, aplique el proceso de Gram-Schmidt a 
la base B para obtener una base ortogonal para el espacio con 
producto interno V relativo al producto interno dado. 


37. V=RB= le 


1 
A | 1 ] » con el producto interno 
del ejemplo 7.2 


- 1 1 
38. V = R, B = l (e A » con el producto interno 


que sigue al ejemplo 7.3 
39. V=P,,B=41,1+x,1 + x + x?), con el producto 
interno del ejemplo 7.4 


Ex 40. V= P,[0,1], B = {1,1 + x,1 + x + x%), con el pro- 


ducto interno del ejemplo 7.5 


là 41. (a) Calcule los tres primeros polinomios normalizados 


de Legendre. (Vea el ejemplo 7.8.) 
(b) Use el proceso de Gram-Schmidt para encontrar el 
cuarto polinomio normalizado de Legendre. 


42. Si el polinomio de Legendre de grado n se multiplica 
por un escalar adecuado es posible obtener un polino- 
mio L,,(x) tal que L,(1) = 1. 

(a) Encuentre Ly(x), L(x), L(x) y L(x). 
(b) Puede demostrarse que L,(x) satisface la relación de 
recurrencia 
2n = 1 
n 


n=" 
LA 


L,(x) = xL,,-1(x) _ 
para todo n = 2. Verifique esta recurrencia para L,(x) y 
Lx(x). Luego úsela para calcular L,(x) y L(x). 

43. Verifique que si W es un subespacio de un espacio V con 
producto interno y v está en V, entonces perp y (v) es 
ortogonal a todo w en W. 
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44. Sean u y v vectores en un espacio con producto interno (b) Use su conocimiento de las ecuaciones cuadráticas y 
V. Demuestre la Desigualdad de Cauchy-Schwarz para sus gráficas para obtener una condición sobre a, b y 
u % 0 del modo siguiente: c para la cual sea verdadera la desigualdad en el in- 
(a) Sea t un escalar real. Entonces (tu + v, tu + v) = 0 ciso (a). 
para todos los valores de t. Expanda esta desigual- (c) Demuestre que, en términos de u y v, su condición 
dad para obtener una desigualdad cuadrática de la en el inciso (b) es equivalente a la desigualdad de 
forma Cauchy-Schwarz. 


at +bt+c2=0 


¿Cuáles son a, b y c en términos de u y v? 


E l jó 


Vectores y matrices con entradas complejas 


En este libro se desarrollaron la teoría y las aplicaciones de los espacios vectoriales reales, 
cuyo ejemplo más básico es R”. También se exploraron los espacios vectoriales finitos Z, 
y sus aplicaciones. El conjunto C” de n-tuplos de números complejos también es un es- 
pacio vectorial, con los números complejos € como escalares. Los axiomas de espacio 
vectorial (sección 6.1) se cumplen todos para C”, y los conceptos como independencia 
lineal, base y dimensión se trasladan desde R” sin dificultad. 

La primera diferencia notable entre R” y C” está en la definición de producto punto. 


. i 
Si el producto punto se define en C” como en R”, entonces para el vector v = H 


distinto de cero se tiene 


Iv] = Vv-v = V° + °? = V-1+1=vV0=0 


Ésta claramente es una situación indeseable (un vector distinto de cero cuya longitud es 
cero) y viola los Teoremas 1.2(d) y 1.3. Ahora el producto punto se generaliza a C” en 
una forma que evita este tipo de dificultad. 


u Un 
Definición siu=| : [y v= | : |son vectores en C”, entonces el producto 
n Vn 


punto complejo de u y v se define mediante 


UVA) 


TONE 


La norma (o longitud) de un vector complejo v se define como en el caso real: 
[vi] = Vv- v. Del mismo modo, la distancia entre dos vectores complejos u y v todavía 
se define como d(u, v) = [u—v]|. 


Y 


1. Demuestre que, parav = | : |enC*,[w] = Y |v?] + |W%] +---+ [v?2]. 
Y, 

le Se 
(a) uv (b) [ul (c) lv] (d) d(u, v) (e) un vector distinto de cero ortogonal a u 


1 lei 
2. Sean u = ipy = . Encuentre 


(£) un vector distinto de cero ortogonal a v 


El producto punto complejo es un ejemplo de la noción más general de un producto 
interno complejo, que satisface las mismas condiciones que un producto interno real 
con dos excepciones. El problema 3 ofrece un resumen. 


3. Demuestre que el producto punto complejo satisface las siguientes propiedades 
para todos los vectores u, v y w en C” y todos los escalares complejos. 


(b) u-(v + w) =u-v+u-w 
(c) (cu) v=c(u-v) y u-(cv) =c(u:v) 
(d) u:u=0 y u:u=0 siysólosi u = 0. 


Para matrices con entradas complejas, la suma, la multiplicación por escalares com- 
plejos, la transpuesta y la multiplicación de matrices se definen todas exactamente como 
se hizo para las matrices reales en la sección 3.1, y las propiedades algebraicas de dichas 
operaciones todavía se cumplen. (Vea la sección 3.2.) Del mismo modo, se tiene la no- 
ción de inversa y el determinante de una matriz cuadrada compleja tal como en el caso 
real, y las técnicas y propiedades se trasladan todas al caso complejo. (Vea las secciones 
3.3 y 4.2.) 

Sin embargo, la noción de transpuesta es menos útil en el caso complejo que en el 
caso real. La siguiente definición proporciona una alternativa. 


Definición Si A es una matriz compleja, entonces la transpuesta conjugada de A 
es la matriz A* definida por 


APS 


En la definición anterior, A se refiere a la matriz cuyas entradas son los conjugados com- 
plejos de las correspondientes entradas de A; esto es, si A = [a;], entonces A = [a;]. 


4. Encuentre la transpuesta conjugada A* de la matriz dada: 
| i J oa] 2 7 
=p. 3 5 +21 =1 
31 0 1+¿ 
(d A=| 1-1 4 i 


2—i 1+31 ei 
1+i 0 —i 


| 4 0 3-4i 


Las propiedades del conjugado complejo (Apéndice C) se extienden a las matrices, 
como muestra el siguiente problema. 


5. Sean A y B matrices complejas y sea c un escalar complejo. Demuestre las si- 
guientes propiedades: 
(a) A=A (bd) A+FB=A+B 
(c) cA=cA (d) 
(e) (4) = (4) 
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Las matrices hermitianas reciben 
su nombre en honor del 
matemático francés Charles Her- 
mite (1822-1901). Hermite es 
mejor conocido por su prueba de 
que el número e es trascendental, 
pero también fue el primero en 
usar el término matrices ortogo- 
nales y probó que las matrices 
simétricas (y hermitianas) tienen 
eigenvalores reales. 


Las propiedades del problema 5 pueden usarse para establecer las siguientes propie- 
dades de la transpuesta conjugada, que son análogas a las propiedades de la transpuesta 
para matrices reales (Teorema 3.4). 


6. Sean A y B matrices complejas y sea c un escalar complejo. Demuestre las si- 
guientes propiedades: 


(a) (4*)* =A (b) (A + B)* = A* + B* 
(c) (cA)* = zA* (d) (AB)* = B*A* 


7. Demuestre que para vectores u y v en C”, el producto punto complejo satisface 
u: v = uřv. (Este resultado es por lo que el producto punto complejo se definió como se 
hizo. Proporciona el análogo de la fórmula u - v = u” v para vectores en R”.) 


Para matrices reales, se vio la importancia de las matrices simétricas, en especial en 
el estudio de la diagonalización. Recuerde que una matriz real A es simétrica si A? = A. 
Para matrices complejas, la siguiente definición es la generalización correcta. 


Definición Una matriz compleja cuadrada A se llama hermitiana si A* = A; es 
decir, si es igual a su propia transpuesta conjugada. 


8. Demuestre que las entradas diagonales de una matriz hermitiana deben ser 
reales. 


9. ¿Cuáles de las siguientes matrices son hermitianas? 


@a=] 2 pe 1) A=| -1 22] 
i i=k 4 Pi 5 
1 1+4i 3—i 

(OA Mas a (d A=]|1-—4i 2 i 
€ — 

1 — 5i 3 3 +i -i 0 

0 3 2 3 -2 
(e) A=|-3 0 -1 Aa=| 0 2 1 

-2 1 0 -2 5 


10. Demuestre que los eigenvalores de una matriz hermitiana son números reales. 
[Sugerencia: la demostración del Teorema 5.18 puede adaptarse al usar la operación 
transpuesta conjugada. ] 


11. Demuestre que si A es una matriz hermitiana, entonces los correspondientes 
eigenvectores para distintos eigenvalores de A son ortogonales. [Sugerencia: adapte la 
demostración del Teorema 5.19 usando u - v = uë y en lugar de u» v = u”v.] 


Recuerde que una matriz real cuadrada Q es ortogonal si Q7! = Q". La siguiente defini- 
ción brinda el análogo complejo. 


Definición Una matriz compleja cuadrada U se llama unitaria si U`! = U*. 


Como en el caso de las matrices ortogonales, en la práctica no es necesario calcular U”* 
directamente. Sólo es necesario demostrar que UFU = I para verificar que U es unita- 
ria. 


12. ¿Cuáles de las siguientes matrices son unitarias? Para las que lo sean, propor- 
cione sus inversas. 


1 V2 | l +i 1+ y 
(a) la iJ V2 C 
ME 0 JVE 
3/5 —4/5 
(o he sel De ’ en 


A 


Las matrices unitarias se comportan en muchos aspectos como las matrices ortogonales. 
El siguiente problema ofrece algunas caracterizaciones alternativas de las matrices uni- 
tarias. 


13. Demuestre que los siguientes enunciados son equivalentes para una matriz 
compleja cuadrada U: 


(a) U es unitaria. 
(b) Las columnas de U forman un conjunto ortonormal en C” con respecto al producto 
punto complejo. 
(c) Los renglones de U forman un conjunto ortonormal en C” con respecto al producto 
punto complejo. 
(d) ||Uxl| = ||x]| para todo x en C”. 
(e) Ux- Uy = x-y para todo x y y en C”. 
[Sugerencia: Adapte las demostraciones de los Teoremas 5.4-5.7. ] 

14. Repita el problema 12, esta vez al aplicar los criterios del inciso (b) o el inciso 
(c) del problema 13. 


La siguiente definición es la generalización natural de la diagonalizabilidad ortogo- 
nal de las matrices complejas. 


Definición Una matriz compleja cuadrada A se llama diagonalizable unitaria- 
mente si existe una matriz unitaria U y una matriz diagonal D tal que 


UFAU=D 


El proceso de diagonalizar una matriz A de n X n diagonalizable unitariamente imita 
el caso real. Las columnas de U deben formar una base ortonormal para C” que consiste 
de los eigenvectores de A. Por tanto, (1) se calculan los eigenvalores de A, (2) se encuen- 
tra una base para cada eigenespacio, (3) se garantiza que cada base de eigenespacio con- 
sista de vectores ortonormales (con el uso del proceso de Gram-Schmidt y del producto 
punto complejo, si es necesario), (4) se forma la matriz U cuyas columnas son los eigen- 
vectores ortonormales recién encontrados. Entonces UAU será una matriz diagonal D 
cuyas entradas diagonales son los eigenvalores de A, colocados en el mismo orden que 
los correspondientes eigenvectores en las columnas de U. 


15. En cada uno de los siguientes, encuentre una matriz unitaria U y una matriz 
diagonal D tal que UFAU = D. 


2 1 O =l 
waz? :] 0) a J 
T 1 0o 0 
| | alo 2 di 
l= 0 i 
0 1>+:3 3 
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Las matrices en (a), (c) y (d) del problema anterior son todas hermitianas. Es evi- 
dente que toda matriz hermitiana es diagonalizable unitariamente. (Este es el teorema es- 
pectral complejo, que puede demostrarse al adaptar la prueba del Teorema 5.20.) En este 
punto quizá sospeche que lo inverso de este resultado también debe ser verdadero; a 
saber, que toda matriz diagonalizable unitariamente debe ser hermitiana. Pero, por des- 
gracia, jesto es falso! (¿Puede ver dónde deja de funcionar el análogo complejo de la 
prueba del Teorema 5.17?) 

Para un contraejemplo específico, tome la matriz del inciso (b) del problema 15. No 
es hermitiana, pero sí es diagonalizable unitariamente. 

Es evidente que la caracterización correcta de la diagonalizabilidad unitaria es el si- 
guiente teorema, cuya demostración puede encontrarse en libros de texto más avan- 
zados. 


Una matriz compleja cuadrada A es diagonalizable unitariamente si y sólo si 


AFA = AA" 


Una matriz A para la cual AFA = AA? se llama normal. 


16. Demuestre que toda matriz hermitiana, toda matriz unitaria y toda matriz an- 
tihermitiana (A* = —A) es normal. (Note que, en el caso real, este resultado se refiere a 
matrices simétricas, ortogonales y antisimétricas, respectivamente.) 


17. Demuestre que si una matriz cuadrada compleja es diagonalizable unitaria- 
mente, entonces debe ser normal. 
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Desigualdades geométricas 
y problemas de optimización 


Esta exploración introducirá algunas aplicaciones poderosas (y acaso sorprendentes) de 
varias desigualdades, como la desigualdad de Cauchy-Schwarz. Como verá, ciertos pro- 
blemas de maximización-minimización (problemas de optimización), que usualmente 
surgen en un curso de cálculo, ¡pueden resolverse sin usar cálculo! 

Recuerde que la desigualdad de Cauchy-Schwarz en R” afirma que, para todos los 
vectores u y v, 


lu: v| = [uf [v 


con igualdad si y sólo si u y v son múltiplos escalares uno de otro. Si u = 
[a e x] yv = [y +": y,]5 la desigualdad anterior es equivalente a 


att Ss Vx H y E ya 


Al elevar al cuadrado ambos lados y usar notación de suma, se tiene 


(3) =(3)(3») 


Figura 7.4 


Ejemplo 7.9 


Figura 7.5 


La igualdad se sostiene si y sólo si existe algún escalar k tal que y, = kx; para i = 1,...,n. 
Comience por usar Cauchy-Schwarz para obtener un caso especial de una de las más 
útiles de todas las desigualdades. 


1. Sean x y y números reales no negativos. Aplique la desigualdad de Cauchy- 


Schwarz a u | A v | yd ara demostrar que 
NV = = 
Vy 5 vx] P A 


(1) 


con igualdad si y sólo si x = y. 


2. (a) Demuestre la desigualdad (1) directamente. [Sugerencia: eleve al cuadrado 
ambos lados.] (b) La figura 7.4 muestra un círculo con centro O y diámetro AB = AC + 
CB = x + y. El segmento CD es perpendicular a AB. Demuestre que CD = Vxy y use 
este resultado para deducir la desigualdad (1). [Sugerencia: use triángulos semejantes. ] 


El lado derecho de la desigualdad (1) es la familiar media aritmética (o promedio) de 
los números x y y. El lado izquierdo muestra la menos familiar media geométrica de x y 
y. En concordancia, la desigualdad (1) se conoce como la desigualdad media aritmé- 
tica-media geométrica (MA-MG). Se sustenta de manera más general; para n variables 
no negativas X,,..., X„ afirma que 


IA 


n ... 
V X1X> Xy 


con igualdad si y sólo six, = x, =°" = x 


n: 


En palabras: la desigualdad MA-MG dice que la media geométrica de un conjunto de 
números no negativos siempre es menor o igual a su media aritmética, y las dos son pre- 
cisamente la misma cuando todos los números son iguales. (Para la demostración gene- 
ral, vea el Apéndice B.) 

Ahora se explorará cómo puede aplicarse tal desigualdad a problemas de optimiza- 
ción. He aquí un problema de cálculo típico. 


Demuestre que, entre todos los rectángulos cuyo perímetro es 100 unidades, el cuadrado 
tiene el área más grande. 


Solución Si se hacen x y y las dimensiones del rectángulo (vea la figura 7.5), entonces el 
área que se quiere maximizar está dada por 


A=xy 


Se indica que el perímetro satisface 


2x + 2y = 100 


571 


que es lo mismo que x + y = 50. Es posible relacionar xy y x + y usando la desigualdad 
MA-MG: 


pS ar 


NES o, de manera equivalente, xy = ¿(x + y)? 
Dado que x + y = 50 es una constante (y ésta es la clave), se ve que el valor máximo 
de A = xy es 50°/4 = 625 y ocurre cuando x = y = 25. 


¡No hay derivada a la vista! ¿No es impresionante? Note que, en este problema de maxi- 
mización, el paso crucial fue demostrar que el lado derecho de la desigualdad MA-MG 
era constante. En forma similar, es posible aplicar la desigualdad a un problema de mini- 
mización si puede arreglar que el lado izquierdo sea constante. 


Ejemplo 7.10 


Figura 7.6 
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> 


Demuestre que entre todos los prismas rectangulares con volumen de 8 má, el cubo tiene 
el área superficial mínima. 


Solución Como se muestra en la figura 7.6, si las dimensiones de tal prisma son x, y y 
z, entonces su volumen está dado por 


V = xyz 


Por ende, se tiene xyz = 8. El área superficial a minimizar es 
S = 2xy + 2yz + 2zx 


Puesto que este es un problema de tres variables, la cosa obvia por intentar es la ver- 
sión de la desigualdad MA-MG para n = 3, a saber 


IFyYFZ 
gps 


Por desgracia, la expresión para S no aparece aquí. Sin embargo, la desigualdad MA-MG 
también implica que 
S  2xyw+2yz + 22zx 
3 3 
= Y (2xy)(2yz)(2zx) 


= 2 V (xyz) 


= 24/64 = 8 


que es equivalente a S = 24. Por tanto, el valor mínimo de S es 24, y ocurre cuando 


2xy = 2yz = 2zx 
(¿Por qué?) Esto implica que x = y = z = 2 (es decir, el prisma rectangular es un cubo). 


3. Demuestre que entre todos los rectángulos con área de 100 unidades cuadradas, 
el cuadrado tiene el perímetro más pequeño. 


1 
4. ¿Cuál es el valor mínimo de f(x) = x + — para x > 0? 
x 


5. Una caja de cartón, con una base cuadrada y parte superior abierta, se construirá 
a partir de un cuadrado de cartón de 10 cm de lado al cortar cuatro cuadrados en las es- 
quinas y doblar los lados. ¿Cuáles deben ser las dimensiones de la caja con la finalidad de 
hacer el volumen encerrado tan grande como sea posible? 

6. Encuentre el valor mínimo de f(x, y, z) = (x + y) (y + z) (z + x) si x, y y z son 
números reales positivos tales que xyz = 1. 

7. Parax> y > 0, encuentre el valor mínimo dex + . [Sugerencia: puede 
ser útil una sustitución.] y(x = y) 

La desigualdad de Cauchy-Schwarz puede aplicarse a problemas similares, como 
ilustra el siguiente ejemplo. 


Ejemplo 7.11 


- 
Encuentre el valor máximo de la función f(x, y, z) = 3x + y + 2z sujeta a la restricción 
x +y +72 = 1. ¿Dónde ocurre el valor máximo? 


Solución Este tipo de problema por lo general se maneja con técnicas que se estudian 
en un curso de cálculo de varias variables. Aquí se muestra cómo usar la desigualdad de 
Cauchy-Schwarz. La función 3x + y + 2z tiene la forma de un producto punto, así que 
se hace 


x 
u=|1 y v=|y 
2 z 
Entonces la forma en componentes de la Desigualdad de Cauchy-Schwarz produce 
(3x + y + 22} s (3 + 1? + 2P) +y’ +z) 
Por tanto, el valor máximo de la función es V14, y ocurre cuando 
x 3 
y| =k|1 
z 2 


Por tanto, x = 3k, y = k y z = 2k, de modo que 3(3k) + k + 2(2k) = V14. Se tiene que 
k = 1/V14, y en consecuencia 


3/ V14 


2/V14 ma 


8. Encuentre el valor máximo de f(x,y,z) = x + 2y + 4z sujeta a x?+2y?+2*=1. 
2 


z 
9. Encuentre el valor mínimo de f(x, y, z) = x? + y?+ F sujetaax + y + z= 10. 
10. Encuentre el valor máximo de sen 0 + cos 0. 


11. Encuentre el punto sobre la recta x + 2y = 5 que esté más cerca del origen. 


Existen muchas otras desigualdades que pueden usarse para resolver problemas de 
optimización. La media cuadrática de los números x, . . . , x, se define como 


xi + e + xl 
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=P r 
2y 


Figura 7.7 
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Si x ...,x,son distintos de cero, su media armónica está dada por 


n 
lea an 1/60 ap =es ae To. 


Es evidente que las medias cuadrática, aritmética, geométrica y armónica están todas re- 
lacionadas. 


12. Sean x y y números reales positivos. Demuestre que 


Ia 
2 2 1/x + 1/y 


con igualdad si y sólo si x = y. (La desigualdad en el medio es justo MA-MG, así que sólo 
es necesario establecer la primera y tercera desigualdades.) 


13. Encuentre el área del rectángulo más grande que puede inscribirse en un semi- 
círculo de radio r (figura 7.7). 


14. Encuentre el valor mínimo de la función 
(x + y) 
xy 
para x, y > 0. [Sugerencia: (x + y)/xy = (x + y)(1/x + 1/y).] 


fix y) = 


15. Sean x y y números reales positivos con x + y = 1. Demuestre que el valor mínimo de 


was (2-1) (1) 


es $, y determine los valores de x y y para los cuales ocurre. 
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Normas y funciones de distancia 


En la última sección vio que es posible definir la longitud y la distancia en un espacio con 
producto interno. Como verá dentro de poco, también existen algunas versiones de estos 
dos conceptos que no están definidos en términos de un producto interno. 

Para comenzar, es necesario especificar las propiedades que es deseable tenga una 
“función de longitud”. La siguiente definición hace esto, y se usa como su base el Teo- 
rema 1.3 y la desigualdad del triángulo. 


Definición Una norma en un espacio vectorial V es un mapeo que asocia con 
cada vector v un número real [| v/|, llamado la norma de v, tal que se satisfacen las si- 
guientes propiedades para todos los vectores u y v y todos los escalares c: 

1. [lvl] = 0 y ||v]| = 0 si y sólo si v = 0. 

2. levi] = Iellv 

3. [u + v] = ul] + [vi 


Un espacio vectorial con una norma se llama espacio lineal normado. 


Ejemplo 7.12 


- 
Demuestre que, en un espacio con producto interno, ||v|| = Y (v, v) se define una norma. 


Solución Claramente, Y (v, v) = 0. Más aún, 
Vv, v =0S(vvw=0S5v=0 


por la definición de producto interno. Esto demuestra la propiedad (1). 
Para la propiedad (2), sólo es necesario notar que 


lev = Y(ev, cv) = Vew, y) = Ve yv, v) = lellvl 


La propiedad (3) es justo la desigualdad del triángulo, lo que se verificó en el Teo- 


rema 7.4. 


Ahora se observarán algunos ejemplos de normas que no están definidas en térmi- 
nos de un producto interno. El ejemplo 7.13 es la generalización matemática a R” de la 
norma de taxi que se exploró en la introducción de este capítulo. 


Ejemplo 7.13 


> 

La norma suma | vl|. de un vector v en R” es la suma de los valores absolutos de sus com- 
Ss 

ponentes. Esto es, si v = [v, =: v,]”, entonces 


[vls = [mi +++ | 


nl 


Demuestre que la norma suma es una norma. 


Solución Claramente, ||v||, =|v,| + + + |v,] = 0, y la única forma de lograr la igualdad 
es si]v,] = + = |v,| = 0. Pero esto es así si y sólo si v, =*** = v, = 0 o, de manera equi- 
valente, v = 0, lo que demuestra la propiedad (1). Para la propiedad (2), se ve que 
cv = [cev] = cv,]*, de modo que 


levls = levi] + + leva] = [e[(lm] + + v,1) = lelllvil, 
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Finalmente, se sustenta la desigualdad del triángulo, porque si u = [u, "= u,]*%en- 
tonces 


[u + vls = lu, + v,] +++ lu, + v, 
S (j| + Ml) +++ (lu, + [val) 


= ([u| +++ 9, ]) + (Im ] +++ val) = Jul, + [vil 


La norma suma también se conoce como la 1-norma y con frecuencia se denota me- 
diante||v|| ,. Sobre R? es lo mismo que la norma de taxi. Como demuestra el ejemplo 7.13, 
es posible tener varias normas en el mismo espacio vectorial. El ejemplo 7.14 ilustra otra 
norma sobre R”. 


z= 
Ejemplo 7.14 La norma máx [v| ,, de un vector v en R” es el número más grande entre los valores ab- 
solutos de sus componentes. Esto es, si v = [v, => v,]% entonces 
[vln = máx [y], .. > lvl) 


Demuestre que la norma máx es una norma. 


Solución Nuevamente, es claro que||v[|,,, = 0. Si ||v||„, = 0, entonces el mayor de|v,|...., 
[v,|es cero, y por tanto todos lo son. En consecuencia, v, =*** = v, = 0, de modo que v = 0. 
Esto verifica la propiedad (1). A continuación, observe que para cualquier escalar c, 


levla = máx([cv,], ....., lev, 1) = Jeļmáx{ [vi]. -> [valj = [ellln 
Finalmente, para u = [u, =+ u„]", se tiene 
ju + vln = máx{|u + v,l,..., lu, + val} 
< máx{|u| + lv,l,..., Jun] + wal} 
S máx¿ [4], ..., lu] + máx([v), -> lv, 1) = ala + Ivl 


(¿Por qué la segunda desigualdad es verdadera?) Esto verifica la desigualdad del trián- 


gulo. 


La norma máx también se conoce como la co-norma o norma uniforme y con fre- 
cuencia se denota mediante ||v||„. En general, es posible definir una norma ||v||, sobre R” 
mediante 


Ivl = (lv)? +++ [v,1?9% 


para cualquier número real p = 1. Para p = 1, lvl, = ||v 
1-norma. Para p = 2, 


Iv = (++ 9 = YE FR 


que es justo la norma familiar sobre R” que se obtiene a partir del producto punto. Lla- 
mada 2-norma o norma euclidiana, con frecuencia se denota ||v|| p. Conforme p se hace 
grande, puede demostrarse usando cálculo que ||v||, tiende a la norma máx ||v||„. Esto 
justifica el uso de la notación alternativa ||v||_, para esta norma. 


+ lo que justifica el término 


m 


Ejemplo 7.15 


> 


Para un vector v en Z5, defina ||v|| como w(v), el peso de v. Demuestre que esto define 
una norma. 
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Solución Ciertamente, ||v|| = w(v) = 0 y el único vector cuyo peso es cero es el vector 
cero. Por tanto, la propiedad (1) es verdadera. Dado que los únicos candidatos para el es- 
calar c son 0 y 1, la propiedad (2) es inmediata. 

Para verificar la desigualdad del triángulo, observe primero que si u y v son vectores 
en Z}, entonces w(u + v) cuenta el número de lugares en los que difieren u y v. [Por 
ejemplo, si 

u=[1 1010 y v=[0 1 1 1 1] 
entoncesu+w=[1 0 1 0 1]%demodo que w(u + v) = 3, en concordancia con 
el hecho de que u y v difieren exactamente en tres posiciones.] Suponga que tanto u 
como v tienen ceros en las posiciones 1, y números 1 en las posiciones n}, u tiene 0 y v 
tiene un 1 en las pocisiones ną, y u tiene un 1 y v tiene un 0 en las posiciones no. (En el 
ejemplo anterior, ny = 0,1, = 2, no, = 2, y My = 1.) Ahora 

w(u) = n, + now W(V)=M+ Mp y w(u +v) = no + Mo 


Por tanto, 


|u + vla = w(u + v) = no + no 
= (ni + nwo) + (n + nga) — 2n 
< (ni + no) + (ni + nga) 
= w(u) + w(v) = [uly + Ivl 


La norma ||v|| ,, se llama norma de Hamming. 


o -<+ 


Para cualquier norma, se puede definir una función de distancia tal como se hizo en la 
última sección, a saber, 


d(u, v) = |u — v| 


Ejemplo 7.16 


3 =] 
Sean u = | 3 y v= | J Calcule d(u, v) en relación con (a) la norma euclidiana, 


(b) la norma suma y (c) la norma máx. 


4 
Solución Cada cálculo requiere saber que u — v = | le 


(a) Como ahora es muy familiar, 
d¿(u, v) = |u — vlg = V4 + (23)? = y25 = 5 


(b) d,(u, v) = u — vls = |4| + |-3| =7 


(c) d,,(u, v) = [fu — vil, = máx{ļ4|, |-3|} = 4 | 


La función de distancia sobre Z} determinada por la norma de Hamming se conoce 
como distancia de Hamming. En la sección 7.5 se explorará su uso en los códigos de co- 
rrección de errores. El ejemplo 7.17 ofrece una ilustración de la distancia de Hamming. 
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Ejemplo 7.17 


Encuentre la distancia de Hamming entre 
u=[1 1 0 1 0 y v=[0 1 1 1 1] 
Solución Dado que se trabaja sobre Z,, u — v = u + v. Pero 
du, v) = Ju + va = w(u + v) 


Como se hizo notar en el ejemplo 7.15, este es justo el número de posiciones en las que 
difieren u y v. Los vectores dados son los mismos que se usaron en dicho ejemplo; en 
consecuencia, el cálculo es exactamente el mismo. Por tanto, dy (u, v) = 3. 


El Teorema 7.5 resume las propiedades más importantes de una función de distancia. 


Teorema 1.5 


Sea d una función de distancia definida sobre un espacio lineal normado V. Las si- 
guientes propiedades se cumplen para todos los vectores u, v y w en V: 


a. d(u, v) =0 y d(u, v) = 0 si y sólo si u = v. 
b. d(u, v) = d(v, u) 
c. d(u, w) = d(u, v) + d(v, w) 


Demostración (a) Al usar la propiedad (1) de la definición de una norma, es fácil com- 
probar que d(u, v) = ||u — v|| = 0, donde la igualdad se sostiene si y sólo si u — v = 0 o, 
de manera equivalente, u = v. 


(b) En el ejercicio 19 se le pide demostrar la propiedad (b). 
(c) Aplique la desigualdad del triángulo para obtener 


d(u, v) + d(v, w) = |u — vi] + |v — wll 
= [(u — v) + (v — w)l 
= |u — w| = d(u, w) B 


A una función d que satisfaga las tres propiedades del Teorema 7.5 también se le 
llama métrica y a un espacio vectorial que posea tal función se le llama espacio métrico. 
Ambos son muy importantes en muchas ramas de las matemáticas y se estudian con de- 
talles en cursos más avanzados. 


Es posible definir normas para matrices exactamente como se definieron las normas 
para los vectores en R”. Después de todo, el espacio vectorial M„„ de todas las matrices 
de m X n es isomórfico a [R””, de modo que no es difícil hacerlo. Desde luego, las pro- 
piedades (1), (2) y (3) de una norma también se cumplen en el escenario de las matrices. 
Es evidente que, para matrices, las normas que son más útiles satisfacen una propiedad 
adicional. (La atención se centrará en matrices cuadradas, pero es posible generalizar 
todo a matrices arbitrarias). 
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Definición Una norma matricial sobre M,, es un mapeo que asocia con cada 
matriz A de n X n un número real ||A||, llamado norma de A, tal que todas las matri- 


ces A y B den X n y todos los escalares c satisfacen las siguientes propiedades. 

1. [lA = 0 y [A] = 0 si y sólo si A = O. 

2. [IcAl] = |A] 

3. A + Bl = |A] + [B| 

4. AB] =|4]11Bl 
Se dice que una norma matricial sobre M,,, es compatible con una norma vectorial 
|x|| sobre R” si, para toda matriz A de n X n y todos los vectores x en R”, se tiene 


lAx| = Alx 


Ejemplo 7.18 


z= 
La norma de Frobenius |A ||; de una matriz A se obtiene al extender las entradas de la 
matriz en un vector y luego tomar la norma euclidiana. En otras palabras: || A|| p es justo 
la raíz cuadrada de la suma de los cuadrados de las entradas de A. De este modo, si 


A=[a;], entonces 
lAl =4/ S a aj 
ij=1 
(a) Encuentre la norma de Frobenius de 


as 


(b) Demuestre que la norma de Frobenius es compatible con la norma euclidiana. 


(c) Demuestre que la norma de Frobenius es una norma matricial. 


Antes de continuar, observe que si T 1] y A, =[2_ 4] son los vectores 


renglón de A, entonces || A, l|¿ = V32 + Y laz lg = y > + 4°. Por tanto, 
lall = v Ilall + [14,11% 


3 = 
De igual modo, sia, = H ya = | 1] son los vectores columna de A, entonces 


All, = Y lla, Il: + lla, ll 


Es fácil ver que estos hechos se extienden a matrices de n X n en general. Estas observa- 
ciones se usarán para resolver los incisos (b) y (c). 


(b) Escriba A= 
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Entonces 
Ax 
Axl, = 


A,X E 


= VIA xp + + + Axl 


< Vlla + ++ + Aall 


= (VIA II + = + Al llxlle 
= (Al ellxcll 
donde la desigualdad surge de la desigualdad de Cauchy-Schwarz aplicada a los produc- 
M== tos punto de los vectores renglón A, con el vector columna x. (¿Ve cómo se aplicó 


Cauchy-Schwarz?) Por tanto, la norma de Frobenius es compatible con la norma eucli- 
diana. 


(c) Sea b; la ¡-ésima columna de B. Al usar la representación matriz-columna del pro- 
ducto AB, se tiene 


4B[|, = [[[4b, -+ Ab,] Il; 


= VI Ab,I]% + = + [14b,l|% 


< VIlAló bill: + = + Aebi por el inciso (b) 


= lAl Vibl + ++ + lbI 
= (All, 11811 


lo que demuestra la propiedad (4) de la definición de una norma matricial. Las propie- 
dades (1) a (3) son verdaderas, pues la norma de Frobenius se obtiene de la norma eu- 
clidiana, que satisface dichas propiedades. Por tanto, la norma de Frobenius es una 


norma matricial. | 


Para muchas aplicaciones, la norma matricial de Frobenius no es la mejor (o la más 
sencilla) de usar. Los tipos más útiles de normas matriciales surgen de considerar el 
efecto de la transformación matricial correspondiente en la matriz cuadrada A. Esta 
transformación mapea un vector x en Ax. Una forma de medir el “tamaño” de A es com- 
parar [|x|] y [Ax] usando cualquier norma (vectorial) conveniente. Piense por adelantado. 
Cualquiera que sea la definición de ||A|| a la que se llegue, se sabe que uno quiere que sea 
compatible con la norma vectorial que se utiliza; esto es, se necesitará 


_ [Ax] _ 
[Ax] = lAlllx] o ki |A| para x#0 
ege MAE AA 2. . l 
La expresión jx] mide la “capacidad de estiramiento” de A. Si se normaliza cada vec- 
x 
a 1 
tor x distinto de cero al dividirlo por su norma, se obtienen vectores unitarios x = ES 
x 
y por tanto 
[Ax 1 1 1 y 
= Ax] = |(a)| = [al —x)| = 1431 
EE lx lx 
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Figura 7.8 


Si x varía sobre todos los vectores distintos de cero en R”, entonces x varía sobre todos 
los vectores unitarios (esto es, la esfera unitaria) y el conjunto de todos los vectores Ax 
determina alguna curva en R”. Por ejemplo, la figura 7.8 muestra cómo la matriz 


3 2 
A= f a afecta a la circunferencia unitaria en R?, mapeándola en una elipse. Con la 


norma euclidiana, el valor máximo de [Ax] es claramente justo la mitad de la longitud 
del eje principal; en este caso, 4 unidades. Esto se expresa al escribir máx ||Ax|| = 4. 


[ear 


En la sección 7.4 se verá que este no es un fenómeno aislado. Esto es: 


¿ 11AxIl tad 
áxJlA x 


x m 
x#0 [xl [x=1 


siempre existe, y hay un vector unitario particular y para el cual || Ay es máximo. Ahora 
se demostrará que [A] = máx||Ax|| define una norma matricial. 
| 


Ix|=1 


Teorema 7.6 


Si ||x|| es una norma vectorial sobre R”, entonces [A] = máx ||Ax|| define una norma 
|xļ=1 


matricial sobre M,,, que es compatible con la norma vectorial que lo induce. 


Demostración (1) Ciertamente, || Ax|| = 0 para todos los vectores x, de modo que, en 


particular, esta desigualdad es verdadera si ||x|| = 1. Por tanto, también ||A|| = máx]| Ax] 
Ix|=1 


= 0. Si||A|| = 0, entonces se debe tener || Ax|| = 0 (y, en consecuencia, Ax = 0) para todo 
xcon||x|| = 1. En particular, Ae; = 0 para cada uno de los vectores base estándar e, en R”. 
Pero Ae, es justo la i-ésima columna de A, de modo que se debe tener A = O. Por el con- 
trario, si A = O, es claro que ||A|| = 0. (¿Por qué?) 


(2) Sea c un escalar. Entonces 


[cA] = máx[[cAx]| = máx|c| [Ax] = [c]máx[ 4x] = [c/Al] 
=I [x= |x=: 
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(3) Sea B una matriz de n X n y sea y un vector unitario para el cual 


|A + B| = moa (A + B)x|| = |(A4 + B)y|| 
Entonces [A + Bl = |(A + B)yll 
= ||Ay + Byl 
= |Ayl + ||Byl 
= |All + |B| 


(¿De dónde proviene la segunda desigualdad?) A continuación se demuestra que la defi- 
nición es compatible con la norma vectorial [propiedad (5)] y luego se usa este hecho 
para completar la demostración de que se tiene una norma matricial. 


(5) Six = 0, entonces la desigualdad || Axl| = ||A||||x|| es verdadera, pues ambos lados son 
cero. Six + 0, entonces, a partir de los comentarios que anteceden a este teorema, 

A A 

Ax. Axl 


= máx = |A| 
[x| o xl 


Por tanto, || Ax|| = [4[ xl. 
(4) Sea z un vector unitario tal que |AB| = máx||(AB)x|| = ||ABz||. Entonces 


lx =1 
[AB] = [4Bz_] 
= |/A(Bz)| 
= [41 8z] por la propiedad (5) 


< [4/1 BI zl por la propiedad (5) 
= 41181 


Esto completa la demostración de que||A|| = máx[|/4x| define una norma matricial sobre M,,, 
x|=1 


que es compatible con la norma vectorial que lo induce. 


Definición La norma matricial ||A||en el Teorema 7.6 se llama operador norma 
inducida por la norma vectorial ||x||. 


El término operador norma refleja el hecho de que una transformación matricial que 
surge de una matriz cuadrada también se llama operador lineal. Por tanto, esta norma es 
una medida de la capacidad de estiramiento de un operador lineal. 

Los tres operadores para normas de uso más común son los inducidos por la norma 
suma, la norma euclidiana y la norma máx, a saber, 


al, = mi Aa lAl = anti A (i lAl = es Ax, 
Ape 


Ixl:=1 [xln=1 


respectivamente. La primera y la última evidencian tener fórmulas especialmente agra- 
dables que las hacen muy fáciles de calcular. 
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Teorema 7.7 Sea A una matriz de n X n con vectores columna a; y vectores renglón A, para i = 


T E 


a. Al = 


J= leses A E 


b. lAl = máx {lAl} = máx (3 al} 
n i= j=1 


A A O os n 


En otras palabras, [| A], es la suma columna absoluta más grande, y [ A. es la suma 
renglón absoluta más grande. Antes de probar el teorema, observe un ejemplo para ver 
cuán fácil es usarlo. 


Ejemplo 7.19 | so 


1 =3 2 
A= 4 -1 -2 
=5 1 3 


Encuentre || All y |All 


Solución Claramente, la suma absoluta de columna más grande está en la primera co- 
lumna, de modo que 


lAl = fla, = [1] + j4] + |-5]| = 10 
El tercer renglón tiene la suma absoluta de renglón más grande, de modo que 
lAl = lAl = [25] + [1] + [3] = 9 


Con referencia a la definición Al, = leds se ve que el valor máximo de 10 


|x,=1 
en realidad se logra cuando se toma x = e,, pues entonces 
[Ael = lal = 10 = [Al 


Para [Allo = máx |Ax|m si se toma 


|x|, =1 
=1 
x= 1 
1 
se obtiene 
I =3 2 =1 -2 
ILAaxll,, = 4 -1 -2 1 = ||| —7 
-5 1 3 ll, 9 [Il 


máx(|-2|, |=74 |91} = 9 = (Al. 


+ 


Estas observaciones se usarán para demostrar el Teorema 7.7. 
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Demostración del Teorema 7.7 La estrategia es la misma que en el caso de la suma de 
columna y de la suma de renglón. Si M representa el valor máximo, se demuestra que 
| Ax[| = M para todos los vectores unitarios x. Entonces se encuentra un vector unitario 
específico x para el cual ocurre la igualdad. Es importante recordar que, para la propie- 
dad (a), la norma vectorial es la norma suma, mientras que para la propiedad (b) es la 
norma máx. 


(a) Para demostar (a), sea M =- máx (aj), la suma columna absoluta máxima y sea 
j=L..., 


lx], = 1. Entonces |x| +: + |x,] = 1, de modo que 
Ax], = xia RSR XA; 
[allais qep PAJEAA 
bo JM + + |x,]M 
= (pal ++ lx] M=1-M=M 


IA 


IA 


Si la suma columna absoluta máxima ocurre en la columna k, entonces con x = e, se ob- 
tiene 


Aes = lay], = M 


Por tanto, |A| = máx||Ax|, =M = máx {llall} como se requiere. 
j=1,...,n 


IIx,=1 j > 


(b) La demostración de la propiedad (b) se deja como ejercicio 32. _A 


En la sección 7.4 se descubrirá una fórmula para el operador norma ||A||,, aunque no 
es tan factible computacionalmente como la fórmula para [| Al|, o | All... 


El número de condición de una matriz 

En la Exploración: “Mentiras que me dice mi computadora” del capítulo 2, se encontró 
la noción de un sistema mal condicionado de ecuaciones lineales. He aquí la definición 
como se aplica a matrices. 


Definición Una matriz A está mal condicionada si pequeños cambios en sus en- 
tradas pueden producir grandes cambios en las soluciones de Ax = b. Si pequeños 
cambios en las entradas de A sólo producen pequeños cambios en las soluciones de 
Ax = b, entonces A se llama bien condicionada. 


Aunque la definición se aplica a matrices arbitrarias, la atención se centrará en las 
matrices cuadradas. 


Ejemplo 7.20 


1 


| está mal condicionada. 
1 1.0005 


Demuestre que A = | 


3 
Solución Si toma b = | 
3.0010 


1 
entonces la solución a Ax = b es x = Pi Sin em- 


bargo, si A cambia a 
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: . 2 i 
entonces la solución cambia a x’ = | l | (Compruebe estas afirmaciones.) Por tanto, un 


cambio relativo de 0.0005/1.0005 = 0.0005, o aproximadamente 0.05%, causa un cam- 
bio de (2 — 1)/1 = 1, o 100%, en x, y (1 — 2)/2 = —0.5, o —50%, en x,. En consecuen- 


cia, A está mal condicionada. 


Es posible usar normas matriciales para ofrecer una forma más precisa de determi- 
nar cuándo una matriz está mal condicionada. Piense en el cambio de A a A’ como en 
un error AA que, a su vez, introduce un error Ax en la solución x de Ax = b. Entonces 
A' =A+AAyx' =x + Ax. En el ejemplo 7.20, 


0 1 
AA = | E | y Ax = | | 
0 0.0005 —]1 


Entonces, puesto que Ax = b y A'x' = b, se tiene (A + AA) (x + Ax) = b. Al expandir 
y cancelar Ax = b, se obtiene 


A(Ax) + (AA)x + (AAJ(Ax) =0 o A(Ax) = —AA(x + Ax) 


Dado que se supuso que Ax = b tiene una solución, A debe ser invertible. Por tanto, la 
última ecuación puede rescribirse como 


Ax = —A (AA) (x + Ax) = A (AA)x' 


Al aplicar normas en ambos lados (usando una norma matricial que sea compatible con 
una norma vectorial), se tiene 


[Ax] = |-47{4AA)x'| = | A~ (A4)x | 
= AAA) | lx" 
SS 


(¿Cuál es la justificación para cada paso?) Por tanto, 


Ax] 
[pe] 


La expresión 47” ||[|4]| se llama número de condición de A y se denota cond(A). Si A no 
es invertible, se define cond(A) = oo. 

¿Qué se hará con la desigualdad anterior? La razón | AA|/ [4] es una medida del cam- 
bio relativo en la matriz A, que se supone es pequeño. De igual modo, | Ax]|/ |x" | es una 
medida del error relativo creado en la solución de Ax = b (aunque, en este caso, el error 
se mide en relación con la nueva solución, x, no con la original, x). Por tanto, la desi- 
gualdad 


[AA] 


IA] 


= AAA] = (AAD 


laxi conga LA a 
lx] 141 


ofrece una cota superior acerca de cuán grande puede ser el error relativo en la solución 
en términos del error relativo en la matriz coeficiente. Mientras más grande sea el nú- 
mero de condición, más mal condicionada estará la matriz, pues habrá más “espacio” 
para que el error sea grande en relación con la solución. 
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Comentarios 

+ El número de condición de una matriz depende de la elección de la norma. Las 
normas más comúnmente usadas son los operadores norma ||Al|, y Al... 

+ Para cualquier norma, cond(4) = 1. (Vea el ejercicio 45.) 


Ejemplo 7.21 


Encuentre el número de condición de A = | | relativo a la oo-norma. 


1 1.0005 


Solución Calcule primero 


t| 2001 nl 
2000 2000 


Por tanto, en la c0-norma (suma absoluta máxima de renglón ), 


Allo. = 1 + 1.0005 = 2.0005 y |A" = 2001 + 


—2000| = 4001 


de modo que cond, (A) = [Alo] Allo. = 4001(2.0005) = 8004. 


Es evidente que si el número de condición es grande en relación con una norma ma- 
tricial compatible, será grande en relación con cualquier norma matricial compatible. 
Por ejemplo, puede demostrarse que para la matriz A de los ejemplos 7.20 y 7.21, 
cond, (A) = 8004, cond, (A) = 8002 (en relación con la 2-norma) y cond, (A) = 8002 
(en relación con la norma de Frobenius). 


La convergencia de los métodos iterativos 


En la sección 2.5 se exploraron dos métodos iterativos para resolver un sistema de ecua- 
ciones lineales: el método de Jacobi y el método de Gauss-Seidel. En el Teorema 2.9 se 
enunció sin demostración que si A es una matriz de n X n estrictamente diagonal do- 
minante, entonces ambos métodos convergen en la solución de Ax = b. Ahora está en 
posición de demostrar este teorema. De hecho, uno de los usos importantes de las nor- 
mas matriciales es establecer las propiedades de convergencia de varios métodos iterativos. 

Aquí sólo se tratará el método de Jacobi. (El método de Gauss-Seidel puede mane- 
jarse usando técnicas similares, pero requiere un poco más de cuidado.) La clave es rees- 
cribir el proceso iterativo en términos de matrices. Vuelva a revisar el ejemplo 2.37 con 
esto en mente. El sistema de ecuaciones es 


(2) 


Zo =] 5 
de modo que a=] | y b=] 5] 
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La ecuación (2) se reescribe como 


5 +x, 
Xx, = 
7 
3 
7 + 3x (e) 
X = 
5 
que es equivalente a 
7%, = da +5 
(4) 


—=3X3 = =x = 7 


o, en términos de matrices, 


AA E 


Estudie cuidadosamente la ecuación (5): la matriz a la izquierda contiene las entradas 
diagonales de A, mientras que en el lado derecho se ve el negativo de las entradas fuera 
de la diagonal de A y el vector b. De este modo, si A se descompone como 


eA R a a 
A= = + + =L+D+U 
J =D 3 0 0 =5 0 0 
entonces la ecuación (5) puede escribirse como 
Dx = —(L + U)x+b 


o, de manera equivalente, 
x= -D(L + U)x + D'b (6) 


pues la matriz D es invertible. La ecuación (6) es la versión matricial de la ecuación (3). 
Es fácil ver que es posible hacer esto en general: una matriz A de n X n puede escribirse 
como A = L + D + U, donde D es la parte diagonal de A, y L y U son, respectivamente, 
las porciones de A abajo y arriba de la diagonal. El sistema Ax = b puede escribirse en- 
tonces en la forma de la ecuación (6), siempre que D sea invertible, lo que ocurre si A 
es estrictamente diagonal dominante. (¿Por qué?) Para simplificar la notación, sean M = 
=D"*(L + U) yc = D"!b de modo que la ecuación (6) se convierta en 


x=Mx>+c (7) 

Recuerde cómo usar esta ecuación en el método de Jacobi. Comience con un vector 

inicial x, y colóquelo en el lado derecho de la ecuación (7) para obtener la primera ite- 

ración x,; esto es, x, = Mx, + c. Luego coloque x en el lado derecho de la ecuación (7) 
para obtener la segunda iteración x, = Mx, + c. En general, se tiene 


Xk+1 7 Mx; +e (8) 


para k = 0. Por el ejemplo 2.37, se tiene 


oral, TE -l 
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1 5 3 
de modo que Xx = E o] + B E B 7 Er] 
5 5 3 i 


0 | pa 4 B o al 
2 0JL1.400 7] [1.829 
etcétera. (Éstos son exactamente los mismos cálculos que se hicieron en el ejemplo 2.37, 
pero escritos en forma matricial.) 

Para demostrar que el método de Jacobi convergirá, es necesario demostrar que las 
iteraciones x, tienden a la solución real x de Ax = b. Es suficiente con demostrar que 


los vectores de error x, — x tienden al vector cero. A partir de los cálculos anteriores, 
Ax = b es equivalente ax = Mx + c. Al usar la ecuación (8), se tiene entonces 


X1 — X = Mx + ce (Mx +c) 
= M(x, — x) 


Ahora se aplica la norma en ambos lados de esta ecuación. (En este punto no es impor- 
tante cuál norma se use en tanto se elija una norma matricial que sea compatible con una 
norma vectorial.) Se tiene 


[xa — A] = [M — 291] = Ml — xl (9) 


Si puede demostrar que [|M|| < 1, entonces tendrá |x}; — x|| < |x, — xl] para toda k = 0, 
y se tiene que [x, — x| tiende a cero, de modo que los vectores de error x, — x tienden al 
vector cero. 

El hecho de que la dominancia diagonal estricta se defina en términos de los valores 
absolutos de las entradas en los renglones de una matriz sugiere que debe elegirse la oo- 
norma de una matriz (el operador norma inducido por la norma máx). Si A = [a;] , en- 
tonces 


0 412/41, 41/11 
M= 003 n E a] an 
Aral Am a] Ann di 0 


(verifique esto), de modo que, por el Teorema 7.7, || M||., es la suma absoluta máxima de 
renglón de M. Suponga que ello ocurre en el k-ésimo renglón. Entonces 


Ata — Akn 


Akk 


[t 


e: 


Imis = | 
E Akk Akk Akk 
[aja] +++ apei] + lar gal + +0: + lanl 


[ayy 


pues A es estrictamente diagonal dominante. Por ende, [M|., < 1, de modo que 
|x — x| > 0, como se quería demostrar. 


> 


Ejemplo 7.22 


Calcule [|MT|., en el ejemplo 2.37 y use este valor para encontrar el número de iteracio- 
nes requeridas para aproximar la solución a una precisión de tres lugares decimales (des- 
pués de redondear) si el vector inicial es x, = 0. 
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f 03 ) 
Solución Ya se calculó M = E a de modo que |M|., = f = 0.6 < 1 (lo que im- 
5 


plica que el método de Jacobi converge en el ejemplo 2.37, como se vio). La solución 
aproximada x, será precisa a tres lugares decimales si el vector de error x, — x tiene la 
propiedad de que cada uno de sus componentes es menor que 0.0005 en valor absoluto. 
(¿Por qué?) Por tanto, sólo es necesario garantizar que el componente absoluto máximo 
de x, — x sea menor que 0.0005. En otras palabras, es necesario encontrar el valor más 
pequeño de k tal que 


Ix, — x |, < 0.0005 


Al usar la ecuación (9) anterior se ve que 


|x; => xl... = IM ollX;-: E xl. = IMIllx,-> => Sly: == IMIKI E xl. 
0.714 
Ahora || M| = 0.6 — = = = = 1.4, de 
[Ml = 0:6 y [xo | 


modo que 


IMIS — xl], = (0.6)(1.4) 


(Si se conoce la solución exacta por adelantado, podría usarse en lugar de x,. En la prác- 
tica, este no es el caso, así que se usa una aproximación de la solución, como se hizo 
aquí.) Por tanto, es necesario encontrar k tal que 


(0.6)(1.4) < 0.0005 
Puede resolver esta desigualdad al aplicar logaritmos (base 10) en ambos lados. Se tiene 
log10((0.6)(1.4)) < logio(5 X 107*) = klog,o(0.6) + logio(1.4) < logro5 — 4 
= -0.222k + 0.146 < —3.301 
= k > 15.5 


Puesto que k debe ser entero, en consecuencia se puede concluir que k = 16 funcionará 
y que 16 iteraciones del método de Jacobi darán una precisión a tres lugares decimales en 
este ejemplo. (De hecho, a partir de los cálculos en el ejemplo 2.37, parece que este grado 
de precisión se consigue más pronto, pero la meta aquí sólo era encontrar una estima- 
ción.) 


3 |Hercieios 1.2 


- 
—1 2 4. (a) ¿Qué mide d, (u, v)? 
En los ejercicios 1-3, seanu = | 4 |yv= | -2 |. (b) ¿Qué mide d,, (u, v)? 
=5 0 


1. Calcule la norma euclidiana, la norma suma y la norma 


máx de u. 


2. Calcule la norma euclidiana, la norma suma y la norma 


máx de v. 


En los ejercicios 5 y 6, seanu =[1 0 1 1 0 0 1'y 
v=[0 1 1 0 1 1 1] 
5. Calcule las normas de Hamming de u y v. 


6. Calcule la distancia de Hamming entre u y v. 


3. Calcule d(u, v) en relación con la norma euclidiana, la 7. (a) ¿Para cuáles vectores v es ||v|| = ||v||„? Explique su 


norma suma y la norma máx. 


respuesta. 
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(b) ¿Para cuáles vectores v es [| v|]. = [|v||,,,? Explique su 
respuesta. 

(c) ¿Para cuáles vectores v es [|v||, = ||vllm = [lvl ¿? Ex- 
plique su respuesta. 


8. (a) ¿En qué condiciones para u y v es |u + v|]; = 
ulle + [vl ? Explique su respuesta. 
(b) ¿En qué condiciones para u y v es 
Ju + vi], = lull; +[|vl|,? Explique su respuesta. 
(c) ¿En qué condiciones para u y v es 
Ju + vl,, = ul, +v]? Explique su respuesta. 


9. Demuestre que para todo v en R”, [vl]; = [vl| y. 


10. Demuestre que para todo v en R”, | v|| ¿ = [vl] 


11. Demuestre que para todo v en 


12. Demuestre que para todo v en 


R", lvli = nllv! 


R", |vlle 5 Vallv]l 


13. Dibuje los círculos unitarios en R? en relación con la 
norma suma y la norma máx. 


14. Al demostrar que la identidad del ejercicio 33 en la sec- 
ción 7.1 fracasa, demuestre que la norma suma no surge 
de cualquier producto interno. 


En los ejercicios 15-18, pruebe que || | define una norma sobre 
el espacio vectorial V. 


Al = máx([2a/, |3|} 


JAJ = miel layi} 


15. V = R?, 


16. V = M, 


mn? 


Boo. v = «0,1101 = | fld 


18. |f| = máx f(a) 


19. Demuestre el Teorema 7.5(b). 


En los ejercicios 20-25, calcule ||A |l} | Al yl Alh. 


2 3 0 —1 
mal] aa? 
4 =3 


1 3 
2 
1 5 
22. A = | | 23.A=|1 3 
=2. =] 
1 
0 =>5 2 4 =2 =] 
24. A = 3 1 =3| 25.4=|0 =1 2 
—4 —4 3 3 =3 0 


En los ejercicios 26-31, encuentre vectores x y y con |x|, = 1 y 
(Yl = 1 tales que All, = [Axl]. y [Alo = Aym donde A 
es la matriz en el ejercicio dado. 

26. Ejercicio 20 27. Ejercicio 21 
29. Ejercicio 23 30. Ejercicio 24 


32. Demuestre el Teorema 7.7(b). 


28. Ejercicio 22 
31. Ejercicio 25 


33. (a) Si|LA[|es un operador norma, pruebe que |I| = 1, 
donde I es una matriz identidad. 
(b) ¿Existe alguna norma vectorial que induzca la 
norma de Frobenius como un operador norma? 
¿Por qué sí o por qué no? 
34. Sea |A|| una norma matricial que sea compatible con 
una norma vectorial |x|. Pruebe que [A = |A| para 
todo eigenvalor A de A. 


En los ejercicios 35-40, encuentre cond, (A) y cond (A). Esta- 
blezca si la matriz dada está mal condicionada. 


3 1 LI =2 
35.4 = 36. A = 
4 2 =3 6 
1 0.99 150 200 
37. A = 38. A = 
1 1 3001 4002 
1 1 1 IE 
39.A=|5 5 6 MA=|5 53 
1.00 2d] 
1 k 
41. Sea A = ; 
l1 1 
(a) Encuentre una fórmula para cond„(A) en términos 
de k. 


(b) ¿Qué le ocurre a cond, (A) conforme k tiende a 1? 
42. Considere el sistema lineal Ax = b, donde A es inverti- 
ble. Suponga que un error Ab cambia b a b' = b + Ab 
Sea x’ la solución del nuevo sistema; esto es, Ax” = b’. 
Sea x’ = x + Ax de modo que Ax representa el error re- 
sultante en la solución del sistema. Demuestre que 


lax conga LAO! 
lx ¡bl 


para cualquier norma matricial compatible. 


10 10 100 
43. Sean A = | [y»= | | 
10 9 99 


(a) Calcule cond, (A). 


, 


(b) Suponga que A cambia a [io 10 ] ¿Cuán 
' f 1011 
grande es el cambio relativo que puede producir 
este cambio en la solución de Ax = b? [Sugerencia: 


use la desigualdad (1) de esta sección. ] 
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(c) Resuelva los sistemas usando A y A” y determine el 46. Demuestre que si A y B son matrices invertibles, enton- 


error relativo real. 


(d) Suponga que b cambia a b' = 


grande 


es el cambio relativo que puede producir este cam- 
bio en la solución de Ax = b? [Sugerencia: use el 


ejercicio 42.] 


ces cond(AB) = cond(A) cond( B) con respecto a cual- 
10 quier norma matricial. 
| | ¿Cuán 


47. Sea A una matriz invertible y sean A, y A, los eigenvalo- 
res con los valores absolutos más grande y más pequeño, 
respectivamente. Demuestre que 


A 
cond (A) = As 


(e) Resuelva los sistemas usando b y b’ y determine el A, 


error relativo real. 


[Sugerencia: vea el ejercicio 34 y el Teorema 4.18(b) en 


1 1 1 1 la sección 4.3.] 
44. SeanA = | 2 5 0|yb=|2 
I =i 2 3 cas Fn los ejercicios 48-51, escriba el sistema dado en la forma de 
(a) Calcule cond; (A). la ecuación (7). Luego use el método del ejemplo 7.22 para es- 
1 l1 1l timar el número de iteraciones del método de Jacobi que se ne- 
(b) Suponga que A cambia a A’ = | 1 5 0 cesitarán para aproximar la solución a una precisión de tres 
1-12 lugares decimales. (Use x, = 0.) Compare su respuesta con la 
¿Cuán grande es el cambio relativo que puede pro- solución calculada en el ejercicio dado de la sección 2.5. 
ducir este cambio en la solución de Ax = b?[Sugeren- 48. Ejercicio 1, sección 2.5 49. Ejercicio 3, sección 2.5 
cia: use la desigualdad (1) de esta sección.] 50. Ejercicio 4, sección 2.5 51. Ejercicio 5, sección 2.5 


(c) Resuelva los sistemas usando A y A” y determine el 


error relativo real. 


(d) Suponga que b cambia ab' = | 1 |. ¿Cuán grande 


El ejercicio 52(c) se refiere al modelo de Leontief de una eco- 
nomía abierta, que se estudió en las secciones 2.4 y 3.7. 


52. Sea A una matriz de n X n tal que ||A|| < 1, donde la 


1 


3 norma es la norma suma o la norma máx. 

es el cambio relativo que puede producir este cam- (a) Pruebe que A” > O conforme n > 00. 

bio en la solución de Ax = b? [Sugerencia: use el (b) Deduzca a partir de (a) que I — A es invertible y 

ejercicio 42.] a r ; 
(e) Resuelva los sistemas usando b y b’ y determine el (=A) SIHA RATA 

error relativo real. [Sugerencia: Vea la demostración del Teorema 3.34.] 

45. Demuestre que si A es una matriz invertible, entonces (c) Demuestre que (b) puede usarse para probar los 

cond(A) = 1 con respecto a cualquier norma matricial. Corolarios 3.35 y 3.36. 


Aproximación por mínimos cuadrados 


En muchas ramas de la ciencia, los datos experimentales se usan para inferir una relación 
matemática entre las variables por medir. Por ejemplo, puede medir la altura de un árbol 
en varios puntos en el tiempo y tratar de deducir una función que exprese la altura h del 
árbol en términos del tiempo t. O puede medir el tamaño p de una población a lo largo 
de tiempo y tratar de encontrar una regla que relacione p con t. Las relaciones entre va- 
riables también son de interés en los negocios; por ejemplo, una compañía que produce 
algunos objetos puede estar interesada en conocer la relación entre sus costos totales c y 
el número n de objetos producidos. 

En cada uno de estos ejemplos, los datos vienen en forma de dos mediciones: una 
para la variable independiente y uno para la (supuesta) variable dependiente. Por ende, 
se tiene un conjunto de puntos de datos (x, y;) y se busca una función que aproxime 
mejor la relación entre la variable independiente x y la variable dependiente y. La figura 
7.9 muestra ejemplos en los que los puntos de datos experimentales se grafican, junto 
con una curva que “ajusta” aproximadamente los datos. 
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Figura 7.9 


Curvas de “mejor ajuste” 


El método de mínimos cuadrados, que está a punto de considerarse, se atribuye a 


Roger Cotes (1682-1716) fue un mate- Gauss. En el día de año nuevo de 1801 se descubrió un nuevo asteroide, Ceres, pero de- 
mático inglés quien, mientras impartía sapareció detrás del Sol poco después de observarse. Los astrónomos predijeron cuándo 
cátedra en Cambridge, editó la segunda y dónde reaparecería Ceres, pero sus cálculos difirieron enormemente de los realizados, 
edición de los Principia de Newton. de manera independiente, por Gauss. Ceres reapareció el 7 de diciembre de 1801, casi 
Aunque publicó poco, hizo importan- exactamente donde Gauss predijo que lo haría. Aunque él no divulgó su método en el 
tes descubrimientos en la teoría de lo- momento, usó su método de aproximación por mínimos cuadrados, que describió en un 
garitmos, cálculo integral y métodos artículo en 1809. En realidad, el mismo método se conocía anteriormente; Cotes anti- 
numerIicos. 


cipó el método a principios del siglo xvm, y Legendre publicó un artículo acerca del 
mismo en 1806. No obstante, por lo general se acredita a Gauss el método de aproxima- 
ción por mínimos cuadrados. 

La exploración de la aproximación comienza con un resultado más general. 
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En ciencias existen muchos problemas que pueden enunciarse generalmente como 
“¿cuál es la mejor aproximación a X del tipo Y?” X puede ser un conjunto de puntos de 
datos, una función, un vector o muchas otras cosas, mientras que Y puede ser un tipo 
particular de función, un vector que pertenezca a cierto espacio vectorial, etcétera. Un 
ejemplo típico de tal problema es encontrar el vector w en un subespacio W de un espa- 
cio vectorial V que se aproxime mejor (es decir, esté más cercaja un vector dado v en V. 
Este problema da lugar a la siguiente definición. 


Definición Si W es un subespacio de un espacio lineal normado V y si v es un 
vector en V, entonces la mejor aproximación a v en W es el vector v en W tal que 


[v —v] < [v — w] 


para todo vector w en W diferente de v. 


En R? o R?, uno está acostumbrado a pensar en “distancia más corta” como lo co- 
rrespondiente a “distancia perpendicular”. En terminología algebraica, “distancia más 
corta” se relaciona con la noción de proyección ortogonal: si W es un subespacio de R” y 
v es un vector en R”, entonces se espera que proyw (v) sea el vector en W que esté más 
cerca de v (figura 7.10). 

Puesto que la proyección ortogonal puede definirse en cualquier espacio con pro- 
ducto interno, se tiene el siguiente teorema. 


WwW 


Figura 7.10 
Si v = proyy(v), entonces 
lv- vil < Iv- wll para todo w + V 


Teorema 7.8 


El teorema de mejor aproximación 


Si W es un subespacio con dimensión finita de un espacio con producto interno V, y 
si v s un vector en V, entonces proyy(v) es la mejor aproximación a v en W. 


Demostración Sea w un vector en W diferente de proy,y(v). Entonces proy,y(v) — w 
también está en W, de modo que v — proyy(v) = perp,y(v) es ortogonal a proy,y(v) 
— w, por el ejercicio 43 de la sección 7.1. Ahora el teorema de Pitágoras implica que 


|? 


|v — proyw(v)|? + |proyw(v) = wl? = |(v — proyw(v)) + (proyw(v) = w) 


|v = wl? 
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como ilustra la figura 7.10. Sin embargo, ||proy,y(v) — w ||? > 0, pues w + proy,y(v), de 
modo que 


|v = proyw(v)|? < |v = proyw(v)I? + [proyw(v) = wl? = [lv -= wl? 


o, de manera equivalente, 


[v — proyw(v)I| < lv — wl — = 
| > 

Ejemplo 7.23 i : 
Sean u; = 2|u=|-2|yv=|2|. Encuentre la mejor aproximación para v 

=] 1 5 


en el plano W = gen(u,, u,) y encuentre la distancia euclidiana de va W. 


Solución El vector en W que aproxima mejor a v es proy,,(v). Puesto que u, y u, son 


ortogonales, 
uv uv 
ro = u +|-— Ju 
proyw(v) (uz) ! = ? 
1 3 3 
= ¿4 2|+39|-2|=|-=5 
-1 1 E 
La distancia de v a W es la distancia de v al punto en W más cercano a v. Pero esta dis- 
tancia es justo ||perpw(v)|| = |v — proyw(v)||. Calcule 
3 3 0 
v- pror) = [2 | 3|=|2 
5 1 24 
3 5 


de modo que |v — proyw(v)| = V0? + (EY + GF = VÆ = 12v5/5 


que es la distancia de v a W. 


En la sección 7.5 se observarán otros ejemplos del teorema de mejor aproximación 
cuando se explore el problema de aproximar funciones. 


Comentario La proyección ortogonal de un vector v sobre un subespacio W se de- 
fine en términos de una base ortogonal para W. El teorema de mejor aproximación pro- 
porciona una prueba alternativa de que proy y (v) no depende de la elección de esta base, 
pues puede haber sólo un vector en W que esté más cercano a v, a saber, proy,y(v). 


Ahora regrese al problema de encontrar una curva que “ajuste mejor” un conjunto de 
puntos de datos. Sin embargo, antes de proceder, es necesario definir qué se entiende por 
“mejor ajuste”. Suponga que los puntos de datos (1, 2), (2, 2) y (3, 4) surgieron de medi- 
ciones tomadas durante algún experimento. Suponga también que existen razones para 
creer que los valores x y y se relacionan mediante un función lineal; esto es, se espera que 
los puntos se encuentren en alguna recta con ecuación y = a + bx. Si las mediciones son 
precisas, los tres puntos satisfarán esta ecuación y tendrá 


2=a+b-1 2=a+b-2 4=a+b-3 
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Éste es un sistema de ecuaciones lineales con dos variables: 


a+ b=2 1 1 2 
a 

a+2b=2 o 1 2 ||] = 2 
b 

a+3b=4 1 3 4 


Desafortunadamente, este sistema es inconsistente (pues los tres puntos no yacen sobre 
una recta). De modo que podrá conformarse con una recta que pase “tan cerca como sea 
posible” por los puntos. Para cualquier recta, se medirá la distancia vertical desde cada 
punto de datos a la recta (lo que representa los errores en la dirección y) y luego se tra- 
tará de elegir la recta que minimice el error total. La figura 7.11 ilustra la situación. 


Figura 7.11 


Cómo encontrar la recta que minimiza sî + e5 + e% 


Si los errores se denotan e,, e, y e, entonces puede formar el vector de error 


Se quiere que e sea tan pequeño como sea posible, de modo que [e] debe estar tan cerca 
de cero como sea posible. ¿Cuál norma usaría? Es evidente que la familiar norma eucli- 
diana es la mejor elección. (La norma suma también sería una elección sensible, pues 
lel; = la| + le, + le; es la suma real de los errores en la figura 7.11. Sin embargo, es di- 
fícil trabajar con los signos de valor absoluto y, como verá dentro de poco, la elección de 
la norma euclidiana conduce a algunas fórmulas muy amigables.) Así que se minimizará 


ell = Vel + ej + es 0, de manera equivalente lle? = ef + el + e 
q 


De aquí proviene el término “mínimos cuadrados”: es necesario encontrar la menor 
suma de cuadrados, en el sentido de la ecuación anterior. El número ||e|| se llama error 
de mínimos cuadrados de la aproximación. 
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A partir de la figura 7.11 también se obtienen las siguientes fórmulas para e,, €, y £; 
en el ejemplo: 


e =2-—(a+b:1) e, =2-(a+b-2) e¿=4- (a + b-3) 


Ejemplo 7.24 


> 
¿Cuál de las siguientes rectas ofrece el menor error de mínimos cuadrados para los pun- 
tos de datos (1, 2), (2, 2) y (3, 4)? 


(a) y=1+x 
(b) y=-2+2x 
()y=3+x 


Solución La tabla 7.1 muestra los cálculos necesarios. 


Tabla 7.1 
y=1+x y =-2+2x y=i+x 
E ¿=(1+D= 4 2=(=2+2)=2 2-(6+1)=3 
E, 2-(1+2)=-1 2- (-2+4)=0 2- 6+2)= — 
Ez 4-(1+3)= 0 4-(-2+6)=0 4-(+3)=! 
i+tartea "er(i+0= 1 e IN O =S 
lel 1 2 VZ = 0.816 


y=l+x 
f 


Figura 7.12 


Se ve que la recta y = į + x produce el menor error de mínimos cuadrados entre 
estas tres rectas. La figura 7.12 muestra los puntos de datos y las tres rectas. 
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Es evidente que la recta y = 5 + x del ejemplo 7.24 produce el menor error de míni- 
mos cuadrados que cualquier recta, aun cuando no pase por ninguno de los puntos 
dados. El resto de esta sección se dedica a ilustrar por qué esto es así. 

En general, suponga que se tienen n puntos de datos (x,, y,), ... -> (X,, y, ) y una recta 
y = a + bx. El vector de error es 


donde e, = y, — (a + bx;). La recta y = a + bx que minimiza ej +:*: + £} se llama apro- 
ximación lineal por mínimos cuadrados (o recta de mejor ajuste) para los puntos (x,, 
Yih- (Xp Y, ). Como se anotó antes del ejemplo 7.24, es posible expresar este problema 
en forma matricial. Si los puntos dados en realidad están sobre la recta v entonces las n 
ecuaciones lineales 


a + bx, =y 


a + bx, > Yn 

serían todas verdaderas (es decir, el sistema sería consistente). El interés está en el caso 
donde los puntos no son colineales, en cuyo caso el sistema es inconsistente. En forma 
matricial se tiene 


l x yı 
1l x% ja y2 
: HE 
l x, Yn 


que es de la forma Ax = b, donde 


1 x Yi 
1 x% a Y 
A= 5 = , b= 
ie H 
Lox, Yn 


El vector de error e es justo b — Ax (compruébelo) y se quiere minimizar ||e||? o, de ma- 
nera equivalente, ||e||. Por tanto, es posible parafrasear el problema en términos de 
matrices del modo siguiente. 


Definición Si A es una matriz de m X n y b está en R”, una solución de míni- 
mos cuadrados de Ax = b es un vector x en [R” tal que 


|b — Ax = |b — Ax] 


para todo x en R”. 
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Cualquier vector de la forma Ax está en el espacio columna de A, y conforme x varía 
sobre todos los vectores en R”, Ax varía sobre todos los vectores en col(A). Por tanto, una 
solución en mínimos cuadrados de Ax = b es equivalente a un vector y en col(A) tal que 


[b — yi = |b — yl 


para todo y en col(A). En otras palabras, se necesita el vector más cercano a b en col(A). 
Por el teorema de mejor aproximación, el vector que se quiere es la proyección ortogo- 
nal de b sobre col(A). Por ende, si x es una solución de mínimos cuadrados de Ax = b, 
se tiene 


AX = proYcora)(b) (1) 


Con la finalidad de encontrar x, parecería que es necesario primero calcular proy.oa)(b) 
y luego resolver el sistema (1). Sin embargo, hay una mejor forma de proceder. 
Se sabe que 


b- Ax=b- PrOYco(A) b = PeT Poola) b) 
es ortogonal a col(A). De modo que, si a; es una columna de A, se tiene 


al(b — AX) = a; (b — AX) = 0 


Esto es cierto si y sólo si 


A*(b e Ax) = (a, ai a„] (b ai Ax) 
a! al(b — Ax) 0 
= (b — Ax) = ; =|:|=0 
a, al(b — Ax) 0 


que, a su vez, es equivalente a 


ATAX = A'b 


Esto representa un sistema de ecuaciones conocido como las ecuaciones normales para X. 

Se acaba de establecer que las soluciones de las ecuaciones normales para X son pre- 
cisamente las soluciones de mínimos cuadrados de Ax = b. Esto demuestra la primera 
parte del siguiente teorema. 


Teorema 7.9 


El teorema de mínimos cuadrados 


Sea A una matriz de m X n y sea b que está en R”. Entonces Ax = b siempre tiene al 
menos una solución de mínimos cuadrados x. Más aún: 


a. X es una solución en mínimos cuadrados de Ax = b si y sólo si X es una solución 
de las ecuaciones normales A"AX = A*b. 

b. A tiene columnas linealmente independientes si y sólo si AA es invertible. En este 
caso, la solución de mínimos cuadrados de Ax = b es única y está dada por 


x = (A'A) "Ab 
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Demostración Ya se estableció la propiedad (a). Para la propiedad (b), note que las 
n columnas de A son linealmente independientes si y sólo si rank(A) = n. Pero esto es 
verdadero si y sólo si ATA es invertible, por el Teorema 3.28. Si ATA es invertible, enton- 
ces la única solución de ATAx = A"b claramente es x = (ATA)™! ATb. 


Ejemplo 1.25 Encuentre una solución de mínimos cuadrados para el sistema inconsistente Ax = b, 
donde 
1 5 3 
A= 2 =2 y b=|2 
ll 1 5 
Solución Calcule 
1 2 =Ii i 6 0 
ATA = 2 -2|= 
a 2 1 0 30 
=] 1 
1 2 1 i 2 
' ml ls 
y =2 1 5 16 


Las ecuaciones normales A"Ax = A*b son justo 
A 
x= 
0 30 16 
1 
3 


que producen x = | $ | El hecho de que esta solución sea única estuvo garantizado por 


15 
el Teorema 7.9(b), pues las columnas de A claramente son linealmente independientes. 


E: 


Comentario El ejemplo 7.25 podría parafrasearse del modo siguiente: encuentre la 
mejor aproximación a b en el espacio columna de A. Las ecuaciones resultantes propor- 
»—> cionan el sistema Ax = b cuya solución de mínimos cuadrados acaba de encontrar. (Ve- 
rifique esto.) En este caso, los componentes de x son los coeficientes de aquella combina- 
ción lineal de las columnas de A que produce la mejor aproximación a b, a saber, 


1 5 3 

1 8 Ea 2 
3) 2|+35|22|=|-=5 
=j 1 E 


Éste es exactamente el resultado del ejemplo 7.23. Compare los dos planteamientos. 


Ejemplo 7.26 


Encuentre la aproximación lineal por mínimos cuadrados para los puntos de datos (1, 
2), (2, 2) y (3, 4) del ejemplo 7.24. 


Solución Ya se vio que el correspondiente sistema Ax = b es 


2 
12 la - 2 
b 
1 4 
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donde y = a + bx es la recta que se busca. Puesto que las columnas de A claramente son 
linealmente independientes, habrá una solución única de mínimos cuadrados, por el in- 
ciso (b) del teorema de mínimos cuadrados. Calcule 


1.1 1 A 3 6 1 1 1 A 8 
A AA A 
1-23 13 6 14 1.2 3 4 18 


Por tanto, puede resolver las ecuaciones normales ATAX = A*b al usar la eliminación 
gaussiana para obtener 
8 
— 
18 


i de donde se ve que a = $, b = 1 son los coeficientes de la apro- 


3 6 


[ATA | A'b] = | 
6 14 


2 
3 


De modo que Xx = E 


ximación lineal por mínimos cuadrados: y = $ + x. 


La recta recién encontrada es la del ejemplo 7.24(c), así que se justifica la afirmación 
de que ésta produce el menor error de mínimos cuadrados para los puntos de datos 
(1, 2), (2, 2) y (3, 4). Note que si X es una solución de mínimos cuadrados de Ax = b, 
puede calcular el error de mínimos cuadrados como 


[el = |b — Axl] 


Dado que AX = proy.ora)(b), esta es justo la longitud de perP.oa)(b); es decir, la distan- 
cia desde b hasta el espacio columna de A. En el ejemplo 7.26 se tuvo 


2 les z 
e=b-Ax=|2|-|1 2[5|- =; 
i 3 

4 3 A 


de modo que, como en el ejemplo 7.24(c), se tiene un error de mínimos cuadrados de 
lel = V4 = 0.816. 


Comentario Note que las columnas de A en el ejemplo 7.26 son linealmente inde- 
pendientes, de modo que existe (ATA) ?, y podría calcular x como X = (ATA) 'A"b. Sin 
embargo, casi siempre es más sencillo resolver las ecuaciones normales usando elimina- 
ción gaussiana (¡o deje que su CAS lo haga por usted!) 


Es interesante observar el ejemplo 7.26 desde dos diferentes puntos de vista geomé- 
tricos. Por un lado, se tiene la aproximación lineal por mínimos cuadrados y = į + x, 
con errores correspondientes £1 = »8=-=3 y e, = 3, como se muestra en la figura 
7.13(a). De manera equivalente, se tiene la proyección de b sobre el espacio columna de A, 
como se muestra en la figura 7.13(b). Aquí, 


1 
P = proyaxa(b) = AX = | 1 2 
3 
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y 
A 
2 
b=12| A. 
4 
El 
3 
= 2 
EI 
i q a a u 
-1 1 2 3 4 5 6 > 
aL W = col(A) 
(a) (b) 
Figura 7.13 
e, 
M=> yel vector de error de mínimos cuadrados es e = | e, |. [¿Cómo se vería la figura 
E3 


7.13(b) si los puntos de datos fuesen colineales?] 


Ejemplo 7.27 


> 
Encuentre la aproximación lineal por mínimos cuadrados y el error de mínimos cua- 
drados para los puntos (1, 1), (2, 2), (3, 2) y (4, 3). 


Solución Sea y = a + bx la ecuación de la recta que se busca. Entonces, al sustituir los 
cuatro puntos en esta ecuación, se obtiene 


a+ b=1 1 1 1 
a+2b=2 1 2 H 2 
a+3b=2 1 3|lb 2 
a+4b=3 1 4 3 


De modo que se quiere la solución de mínimos cuadrados de Ax = b, donde 


> 

II 
= =e a = 
GUN -e 


4 3 


Dado que las columnas de A son linealmente independientes, la solución que se quiere es 
1 

x = (ATA) Ab = E 
5 


(Compruebe este cálculo.) Por tanto, tome a = 3 y b = ¿, lo que produce la aproxima- 
ción lineal por mínimos cuadrados y = 3 + $x, como se muestra en la figura 7.14. 


602 


Capítulo 7 Distancia y aproximación 


Figura 7.14 


Puesto que 


e=b-— Ax= 


GUN NN 
= = a 
A U N e 


el error de mínimos cuadrados es [el] = y5/5 = 0.447. 


i 


Puede usar el método de mínimos cuadrados para aproximar los puntos de datos 
mediante curvas distintas a líneas rectas. 


> 


Ejemplo 7.28 


Encuentre la parábola que ofrezca la mejor aproximación por mínimos cuadrados a los 
puntos (—1, 1), (0, —1), (1, 0) y (2, 2). 


Solución La ecuación de una parábola es la cuadrática y = a + bx + cx?. Al sustituir los 
puntos dados en esta cuadrática, se obtiene el sistema lineal 


a= bie = 1 I. =i 1 1 
a 
a = —] 1 0 0 =] 
o b| = 
a+ b+c = 0 il 1 1 0 
c 
a+2b+4c = 2 1 2 4 2 


Por tanto, se quiere la aproximación por mínimos cuadrados de Ax = b, donde 


1 =i 1 1 

1 0 0 =] 
A= b= 

1 1 1 r 0 

1 2 4 2 
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Calcule 
42 6 2 
AA=|2 6 8| y ADb=]|3 
6 8 18 9 
de modo que las ecuaciones normales están dadas por 
42 6 2 
2 6 8|x=]|3 
6 8 18 9 
cuya solución es 
=% 
10 
rala 


como se muestra en la figura 7.15. 


=1+ (0, —1) 


Figura 7.15 


Una aproximación parabólica por mínimos 


cuadrados f 


Uno de los usos más importantes de la aproximación por mínimos cuadrados es es- 
timar las constantes asociadas con varios procesos. El siguiente ejemplo ilustra esta apli- 
cación en el contexto del crecimiento poblacional. Recuerde de la sección 6.7 que una 
población que crece (o disminuye) exponencialmente satisface una ecuación de la forma 
p(t) = ce", donde p(t) es el tamaño de la población en el tiempo ty c y k son constantes. 
Claramente, c = p(0), pero k no es tan fácil de determinar. Es fácil ver que 


lo que explica por qué a k en ocasiones se le conoce como la tasa de crecimiento relativo 
de la población: es la razón entre la tasa de crecimiento p” (t) y el tamaño de la población 


p. 
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cAS Ejemplo 7.29 


Tabla 7.2 


Año 
1950 
1960 
1970 
1980 
1990 
2000 


Fuente: U.S. Bureau of the Census, Inter- 


national Data Base 


Población 
(en miles de 
millones) 


2.56 
3.04 
3.71 
4.46 
5.28 
6.08 


> 
La tabla 7.2 presenta la población del mundo en intervalos de 10 años durante la se- 
gunda mitad del siglo xx. Si supone un modelo de crecimiento exponencial, encuentre la 
tasa de crecimiento relativa y prediga la población del mundo en 2010. 


Solución Se acuerda medir el tiempo t en intervalos de 10 años, de modo que t = 0 es 
1950, t = 1 es 1960, etcétera. Dado que c = p(0) = 2.56, la ecuación para la tasa de cre- 
cimiento de la población es 


p = 2.56e* 


¿Cómo puede usar el método de mínimos cuadrados en esta ecuación? Si aplica el loga- 
ritmo natural en ambos lados, la ecuación se convierte en lineal: 


In(2.56¢"") 
In 2.56 + ln(e") 
= 0.94 + kt 


ln p 


Al colocar los valores de t y p de la tabla 7.2 se produce el siguiente sistema (donde los 
cálculos se redondearon a tres lugares decimales): 


0.94 = 0.94 
k = 0.172 
2k = 0.371 
3k = 0.555 
4k = 0.724 
5k = 0.865 


Puede ignorar la primera ecuación (corresponde a la condición inicial c = p(0) = 2.56). 
Las ecuaciones restantes corresponden a un sistema Ax = b, con 


1 0.172 
2 0.371 
A =|3 y b= ]0.555 
4 0.724 
5 0.865 


Puesto que AA = 55 y Ab = 9.80, las ecuaciones normales correspondientes son justo 
la ecuación individual 


55x = 9.80 


Por tanto, k = X = 9.80/55 = 0.178. En consecuencia, la solución de mínimos cuadra- 
dos tiene la forma p = 2.56e%*?% (vea la figura 7.16). 
La población del mundo en 2010 corresponde a t = 6, de donde se obtiene 


p(6) = 2.5610 = 7,448 


Por tanto, si el modelo es preciso, habrá aproximadamente 7.45 mil millones de perso- 
nas en la Tierra en el año 2010. (La U.S. Census Bureau estima que la población global 
será “solamente” de 6.82 mil millones en 2010. ¿Por qué cree que su estimación es más 
alta?) 


Sección 7.3 Aproximación por mínimos cuadrados 605 


Población (en miles de millones) 


Décadas desde 1950 
Figura 7.16 


-t 


Mínimos cuadrados vía la factorización QR 


Con frecuencia sucede que las ecuaciones normales para un problema de mínimos cua- 
drados están mal condicionadas. Por tanto, un pequeño error numérico al realizar eli- 
minación gaussiana resultará en un gran error en la solución de mínimos cuadrados. En 
consecuencia, en la práctica, por lo general se usan otros métodos para calcular las apro- 
ximaciones por mínimos cuadrados. 

Es evidente que la factorización QR de A produce una forma más confiable de calcu- 
lar la aproximación por mínimos cuadrados de Ax = b. 


Teorema 7.10 


Sea A una matriz de m X n con columnas linealmente independientes y sea b que está 
en R”. Si A = QR es una factorización QR de A, entonces la única solución por míni- 
mos cuadrados x de Ax = b es 


x = R 'Qb 


Demostración Recuerde del Teorema 5.16 que la factorización QR, A = QR involucra 
una matriz Q de m X n con columnas ortonormales y una matriz triangular superior in- 
vertible R. A partir del teorema de mínimos cuadrados, se tiene 


ATAX = A'b 
= (QR)"QRY = (QR) "b 
= R'Q"QRX = R"Q"b 
= RĪRx = R'Qb 


pues QQ = I. (¿Por qué?) 
Puesto que R es invertible, también lo es R", y en consecuencia se tiene 


Rx = Q%b o, de manera equivalente x = R'Q™b _——— =E 


Comentario Dado que R es triangular superior, en la práctica es más sencillo resol- 
ver RX = Q"b directamente que invertir R y calcular R7'Q?b. 


Capítulo 7 Distancia y aproximación 


Ejemplo 7.30 


Teorema 1.11 


> 


Use la factorización QR para encontrar una solución de mínimos cuadrados de Ax = b, 
donde 


122 2 
=1 1 2 =3 

A= y b= 
—1 0 1 =2 
11.2 0 


Solución A partir del ejemplo 5.15, 


1/2 3y5/10 —v6/6 n i 1/2 
E = | —1/2 3vy5/10 0 
A=QR= -i2 v3/10 v56 0 v5 3vy5/2 


y2 ysno yaa? ° ve 
Se tiene 
1/2 -1/2  -1/2 172 E 7/2 
Qb = | 345/10 3145/10 vy5/10 45/10 =| -45/2 


-v66 0 ve vēl s -21/8/3 


de modo que se requiere la solución de Rx = Q*b, o 


2 1 1/2 7/2 
0 V5 3V5/2 |[x=| -v5/2 
0 0  vV6/2 -2V6/3 
La sustitución inversa produce rápidamente 
4/3 
x= 3/2 


4/3 Ed 


Uno de los subproductos amigables del método de mínimos cuadrados es una nueva 
fórmula para la proyección ortogonal de un vector sobre un subespacio de R”. 


Sea W un subespacio de R” y sea A una matriz de m X n cuyas columnas forman una 
base para W. Si v es cualquier vector en R”, entonces la proyección ortogonal de v 
sobre W es el vector 


proyw(v) = A(ATA) Aly 


La transformación lineal P : R” —> R” que proyecta R” sobre W tiene A(A"A) LA? 
como su matriz estándar. 


Demostración Dada la forma como se construyó A, su espacio columna es W. Puesto 
que las columnas de A son linealmente independientes, el teorema de mínimos cuadra- 
dos garantiza que existe una solución única de mínimos cuadrados para Ax = v dada por 


x = (ATA) Aly 
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Por la ecuación (1), 
Ax = PrOYcoxa)(v) = proyy(v) 
Por tanto, proyy(v) = A((A7A) “A Wy) = (A(47A) AD y 


como se requería. Dado que esta ecuación se cumple para todo v en R”, el último enun- 
ciado del teorema se obtiene inmediatamente. — A 


El Teorema 7.11 se ilustrará al revisar nuevamente el ejemplo 5.11. 


> 

Ejemplo 7.31 3 
Encuentre la proyección ortogonal de v = | —1 | sobre el plano W en R? con ecuación 

2 


x — y + 2z =0, y proporcione la matriz estándar de la transformación de proyección or- 
togonal sobre W. 


Solución Como en el ejemplo 5.11 se tomará como base para W el conjunto 


1 =] 
1 |, 1 
0 1 
Se forma la matriz 
1- =l 
A=|1 1 
0 1 


con estos vectores base como sus columnas. Entonces 


1 == 
. 11 0 2 0 
AA = 1 1|= 
=1 1 1 0 3 
0 
3 0 
de modo que (AA)? = | l 
3 
Por el Teorema 7.11, la matriz estándar de la transformación de proyección ortogonal 
sobre W es 
t mia arad e => 
AAA) A =A=|1 1 E iil [- So 3 
0 ¿l¡=L1 1 1 1 i 1 
0 1l e 3 3 
de modo que la proyección ortogonal de v sobre W es 
ST 
proyy(v) =A(ATA) "A = | 15 jl—i=| 1 
-1 1 ajf 2 —2 
3 3 3 3 


que concuerda con la solución al ejemplo 5.11. | 
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Comentario Dado que la proyección de un vector sobre un subespacio W es única, 
la matriz estándar de esta transformación lineal (dada por el Teorema 7.11) no puede 
depender de la elección de base para W. En otras palabras, con una base diferente para 
W, se tiene una matriz A diferente, ¡pero la matriz A(A7A) A? será la misma! (En el 
ejercicio 43 se le pide verificar esto.) 


La pseudoinversa de una matriz 


Si A es una matriz de n X n con columnas linealmente independientes, entonces es in- 
vertible, y la única solución de Ax = b es x = A" 'b.Sim > ny A es de m X n con co- 
lumnas linealmente independientes, entonces Ax = b no tiene solución exacta, pero la 
mejor aproximación está dada por la solución única de mínimos cuadrados x = 
(ATA) 1A47b. En consecuencia, la matriz (AA) 47 desempeña el papel de un “inverso 
de A” en esta situación. 


Definición Si A es una matriz con columnas linealmente independientes, enton- 
ces la pseudoinversa de A es la matriz A* definida por 


ASS 


Observe que si A es de m X n, entonces A* es de n X m. 


Ejemplo 7.32 


Encuentre la pseudoinversa de A = | 1 


GUN hh 


Solución En el ejemplo 7.26 ya se hicieron la mayoría de los cálculos. Al usar el trabajo 
previo se tiene 


ASAS | 


= wN 
l 
n= = 


Y 
HA 
Rh = 
N e 
Ww = 
SS 
Il 

pj 
al wie 
O w= 

| 
NI= WIN 
b 


La pseudoinversa es una notación abreviada conveniente para algunos de los con- 
ceptos que se han explorado. Por ejemplo, si A es de m X n, con columnas linealmente 
independientes, la solución de mínimos cuadrados de Ax = b está dada por 


x= A'b 
y la matriz estándar de la proyección ortogonal P de R” sobre col(A) es 


Si A en realidad es una matriz cuadrada, entonces es fácil demostrar que A? = A”? 


(vea el ejercicio 53). En este caso, la solución de mínimos cuadrados de Ax = b es la so- 
lución exacta, pues 


A 
»—> 
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La matriz de proyección se convierte en [P] = AA* = AA”? = I. (¿Cuál es la interpreta- 
ción geométrica de esta igualdad?) 
El teorema 7.12 resume las propiedades clave de la pseudoinversa de una matriz. 


(Antes de leer la demostración de este teorema, verifique estas propiedades para la ma- 


triz en el ejemplo 7.32.) 


Teorema 7.12 


para A: 
a. AAA =A 
b. AAA" = A" 


Sea A una matriz con columnas linealmente independientes. Entonces la pseudoin- 
versa A* de A satisface las siguientes propiedades, llamadas condiciones de Penrose 


c. AA* y A*A son simétricas. 


Demostración Se demuestra la condición (a) y la mitad de la condición (c), y se dejan 
las demostraciones de las condiciones restantes como los ejercicios 54 y 55. 


(a) Calcule 


AATA = A((A"A) ADA 
= A(ATA) (A7A) 
=AI=A 


(c) Por el Teorema 3.4, AA es simétrica. Por tanto, (A%A) * también es simétrica, por el 
ejercicio 46 de la sección 3.3. Al tomar la transpuesta de AA* se tiene 


(AA*)" = (A(ATA) AT)" 
= (AT) UATA) TA" 
= A(ATA) AT 


== + 
= AA — 


El ejercicio 56 explora más propiedades de la pseudoinversa. En la siguiente sección 
se verá cómo extender la definición de A* para manejar todas las matrices, ya sea que las 
columnas de A sean o no linealmente independientes. 


Í Ejercicios 1.3 
Y 


En los ejercicios 1-3, considere los puntos de datos (1, 0), 
(2, 1) y (3, 5). Calcule el error de mínimos cuadrados para la 
recta dada. En cada caso, grafique los puntos y la recta. 


l.y=-2+2x 2.y=-3+2% 3.y=-3+3x 


En los ejercicios 4-6, considere los puntos de datos (—5, 3), 
(0, 3), (5, 2) y (10, 0). Calcule el error de mínimos cuadrados 


para la recta dada. En cada caso, grafique los puntos y la recta. 


4.y=2-=x 5.y=3 6. y =2-—:3x 


En los ejercicios 7-14, encuentre la aproximación lineal por 
mínimos cuadrados para los puntos dados y calcular el corres- 
pondiente error de mínimos cuadrados. 


7. (1,0), (2, 1), (3, 5) 
8. (1, 5), (2, 3), (3, 2) 
9. (0, 4), (1, 1), (2, 0) 
10. (0, 2), (1, 2), (2, 5) 
11. (—5, —1), (0, 1), (5, 2), (10, 4) 
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12. (-5, 3), (0, 3), (5, 2), (10, 0) 
13. (1, 1), (2, 3), (3, 4), (4, 5), (5, 7) 
14. (1, 10), (2, 8), (3, 5), (4, 3), (5, 0) 


En los ejercicios 15-18, encuentre la aproximación parabólica 
por mínimos cuadrados para los puntos dados. 


15. (1, 1), (2, —2), (3, 3), (4, 4) 

16. (1, 8), (2,7), (3, 5), (4, 2) 

17. (2, 4), (1, 7), (0, 3), (1, 0), (2, —1) 

18. (-2, 0), (—1, -11), (0, —10), (1, —9), (2, 8) 


En los ejercicios 19-22, encuentre una solución por mínimos 
cuadrados de Ax = b al construir y resolver las ecuaciones 
normales. 


3 1 1 
19 4A=|1 1|,b=|1 
1 2 1 
3 =2 1 
20.4=|1 EN 1 
2 1 1 

1 —-2 4 

2 5 =2 

3 0 4 

2 0 5 

22. A = A ,b = i 

3 1 =] 

=1 2 3 


En los ejercicios 23 y 24, demuestre que la solución por míni- 
mos cuadrados de Ax = b no es única y resuelva las ecuacio- 
nes normales para encontrar todas las soluciones de mínimos 
cuadrados. 


1 1 0 0 1 

1 0 1 1 =3 
23. A = ,b = 

0 -1 1 1 2 

1 =1 1 0 4 

0 1 1 0 5 

Il >L t =l 3 
24. A = ,b = 

1 0 1 0 =1 

1 1 1 1 1 


En los ejercicios 25 y 26, encuentre la mejor aproximación a 
una solución del sistema de ecuaciones dado. 
25. x+ y= z= 2 26. 2x + 3y+z=2l1 
=p = 6 x+ y+z= 7 
I y= z=11 —x+ y-z=14 
—x F z= 0 2y+z2= 0 


En los ejercicios 27 y 28, se proporciona una factorización QR 
de A. Úsela para encontrar una solución por mínimos cuadra- 
dos de Ax = b. 


2 1 2 1 2 
A 3 3 1 
27.A=|2 0|},Q=]|5 —5 =| i = 3 
E: 0 1 
1 1 5 =1 
1 0 1/V6 1/V2 
28.A=| 2 =110=| 2V6 o0 | 
-1 1 -1/V6 1/V2 
1 
Ra AS i 
0 1/12) i 


29. Una pelota de tenis se suelta desde varias alturas y se 
mide la altura que alcanza la pelota en el primer rebote. 
Use los datos de la tabla 7.3 para encontrar la aproxima- 
ción lineal por mínimos cuadrados para la altura de re- 
bote b como una función lineal de la altura inicial h. 


Tabla 7.3 


h(cm) 20 40 48 60 80 100 
b(cm) 14.5 31 36 455 59 73.5 


30. La ley de Hooke afirma que la longitud L de un resorte 
es una función lineal de la fuerza F que se le aplica. (Vea 
la figura 7.17 y el ejemplo 6.92.) En concordancia, exis- 
ten constantes a y b tales que 


L=a + bF 


La tabla 7.4 muestra los resultados de colocar varios 
pesos en un resorte. 


Z 
> 
Z 
Z L 
L< 
F 
Figura 7.17 
Tabla 7.4 
F (02) 2 4 6 8 


L(in) 74 96 115 136 
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Tabla 1.5 
Año de nacimiento 1920 1930 1940 1950 1960 1970 1980 1990 
Esperanza de vida (años) 54.1 59.7 62.9 68.2 69.7 70.8 73.7 75.4 


Fuente: World Almanac and Book of Facts. Nueva York: World Almanac Books, 1999 


(a) Determine las constantes a y b al encontrar la 
aproximación lineal por mínimos cuadrados para 
dichos datos. ¿Qué representa a? 

(b) Estime la longitud del resorte cuando se le coloca 


(b) Use la ecuación para estimar la población esta- 
dounidense en 2010. 


un peso de 5 onzas. Tabla 7.7 
31. La tabla 7.5 proporciona las esperanzas de vida para las Población 
personas nacidas en Estados Unidos en los años dados. y . 
i Ñ ON e Año (en millones) 
(a) Determine la aproximación lineal por mínimos 
cuadrados para dichos datos y úselos para predecir 1950 150 
la esperanza de vida de alguien nacido en 2000. 1960 179 
(b) ¿Qué tan bueno es este modelo? Explique. 1970 203 
32. Cuando un objeto se lanza recto hacia arriba en el aire, 1980 227 
la segunda ley de movimiento de Newton afirma que su 1990 250 
2000 281 


altura s(t) en el tiempo t está dado por 
s(t) = so + vt + igt? 
donde v, es su velocidad inicial y g es la constante de 


aceleración debida a la gravedad. Suponga que se toman 
las mediciones que se muestran en la tabla 7.6. 


Fuente: U.S. Bureau of the Census 


34. La tabla 7.8 muestra los salarios promedio de las gran- 
des ligas de beisbol para los años 1970-2005. 
(a) Encuentre la aproximación cuadrática por mínimos 
cuadrados para dichos datos. 
(b) Encuentre la aproximación exponencial por míni- 


Tabla 7.6 mos cuadrados para dichos datos. 
Tiempo (s) 0.5 1 15 2 3 (c) ¿Cuál ecuación brinda la mejor aproximación? ¿Por 
Altura (m) 11 17 21 23 18 qué? 


(d) ¿Cuál estima que será el salario promedio en las 
grandes ligas de beisbol en 2010 y 2015? 


(a) Encuentre la aproximación cuadrática por mínimos Tabla 7.8 
cuadrados para dichos datos. ; A 
(b) Estime la altura a la cual se liberó el objeto (en m), i Salario promedio 
su velocidad inicial (en m/s) y su aceleración debida Año (riles de dokices) 
a la gravedad (en m/s?). 1970 29.3 
(c) ¿Aproximadamente cuándo golpeará el suelo el ob- 1975 44.7 
jeto? 1980 143.8 
33. La tabla 7.7 proporciona la población de Estados Unidos 1985 371.6 
a intervalos de 10 años para los años 1950-2000. 1990 597.5 
(a) Si supone un modelo de crecimiento exponencial de 1995 1110.8 
la forma p(t) = ce'', donde p(t) es la población en 2000 1895.6 
2005 2476.6 


el tiempo t, use mínimos cuadrados para encontrar 
la ecuación para la tasa de crecimiento de la 
población. [Sugerencia: sea t = 0 en 1950.] 


Fuente: Major League Baseball Players Association 
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35. Una muestra de 200 mg de polonio 210 radiactivo se 
observa mientras decae. La tabla 7.9 muestra la masa 
restante en varios momentos. 

Si supone un modelo de decaimiento exponencial, 
use mínimos cuadrados para encontrar la vida media 
del polonio 210. (Vea la sección 6.7.) 


Tabla 7.9 
Tiempo (días) 0 30 60 90 
Masa (mg) 200 172 148 128 


36. Encuentre el plano z = a + bx + cy que ajusta mejor 
los puntos de datos (0, —4, 0), (5, 0, 0), (4, —1, 1), (1, 
EN 1), y ( l, 5; 2). 


En los ejercicios 37-42, encuentre la matriz estándar de la pro- 
yección ortogonal sobre el subespacio W. Luego use esta matriz 
para encontrar la proyección ortogonal de v sobre W. 


s.w- sa([!]) v- E] 


38. w= gen( | 1] 
=2 1 
1 1 
wwf 1 Jo 2 
1 3 
2 1 
40. W = [| ] vV=|0 
1 0 
1 1 1 
41. W= [| o| 1 av=] 0 
= 1 0 


42. W = gen| | -2|,| 0 
1 =1 3 
43. Verifique que la matriz estándar de la proyección sobre 
W en el ejemplo 7.31 (como se construye mediante el 
Teorema 7.11) no depende de la elección de base. Tome 


1 1 
ds. [3 
0 1 


como una base para W y repita los cálculos para demostrar 
que la matriz de proyección resultante es la misma. 


44. Sea A una matriz con columnas linealmente indepen- 
dientes y sea P = A(A7A) A” la matriz de proyección 
ortogonal sobre col(A). 

(a) Demuestre que P es simétrica. 
(b) Demuestre que P es idempotente. 


En los ejercicios 45-52, calcule la pseudoinversa de A. 


1 
45. A = A 46. A=|-1 
2 
1.3 13 
47.A=|-1 1 48.4 =]3 i 
o 2 203 
Aa] Abal 
aA =l 5o A=], 4 
100 12 0 
E malt 
011 pi = 
111l 00 2 


53. (a) Demuestre que, si A es una matriz cuadrada con 
columnas linealmente independientes, entonces 
AT = A! 
(b) Si A es una matriz de m X n con columnas ortonor- 
males, ¿cuál es A*? 


54. Demuestre el Teorema 7.12(b). 
55. Demuestre la parte restante del Teorema 7.12(c). 


56. Sea A una matriz con columnas linealmente indepen- 
dientes. Demuestre lo siguiente: 


(a) (cA)* = (1/c)A* para todos los escalares c 40. 
(b) (47)* = A si A es una matriz cuadrada. 
(c) (AD)* = (47) si A es una matriz cuadrada. 


57. Se proporcionan n puntos de datos (x, y, ), ... (Xp Yn) 
Demuestre que si los puntos no yacen todos en la 
misma recta vertical, entonces tienen una aproximación 
lineal única por mínimos cuadrados. 


58. Se proporcionan n puntos de datos (x;, y, ), ... , (Xp Yn) 
Generalice el ejercicio 57 para demostrar que si al 
menos k + 1 delos x,,...,x, son distintos, entonces los 
puntos dados tienen una aproximación polinomial 
única por mínimos cuadrados de grado máximo k. 
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La descomposición de valor singular 


En el capítulo 5 se vio que toda matriz simétrica A puede factorizarse como A = PDP", 
donde P es una matriz ortogonal y D es una matriz diagonal que muestra los eigenvalo- 
res de A. Si A no es simétrica, no es posible tal factorización, pero, como se aprendió en 
el capítulo 4, todavía es posible factorizar una matriz cuadrada A como A = PDP L 
donde D es como antes, pero P ahora es simplemente una matriz invertible. Sin em- 
bargo, no toda matriz es diagonalizable, de modo que puede sorprenderle que ahora se 
demostrará que toda matriz (simétrica o no, cuadrada o no) tiene una factorización de 
la forma A = PDQ”, ¡donde P y Q son ortogonales y D es una matriz diagonal! Este re- 
sultado notable es la descomposición de valor singular (DVS) y es una de las factorizacio- 
nes más importantes de todas las matrices. 

En esta sección se demostrará cómo calcular la DVS de una matriz y luego conside- 
rar algunas de sus muchas aplicaciones. En el trayecto se atarán algunos cabos sueltos y 
se responderán algunas preguntas que quedaron planteadas en secciones anteriores. 


Los valores singulares de una matriz 


Para cualquier matriz A de m X n, la matriz AA de n X n es simétrica y en consecuen- 
cia puede ser diagonalizable ortogonalmente , por el teorema espectral. No sólo todos los 
eigenvalores de ATA son reales (Teorema 5.18), todos son no negativos. Para demostrar 
esto, sea A un eigenvalor de ATA con su correspondiente eigenvector unitario v. Enton- 
ces 


0 < ||Av||? = (Av) (Av) = (Av)"Av = v"A"Av 
= vw Av = Mv-v) = Alv]? = A 


Por tanto, tiene sentido sacar raíces cuadradas (positivas) de dichos eigenvalores. 


Definición Si A es una matriz de m X n, los valores singulares de A son las raí- 
ces cuadradas de los eigenvalores de AA y se denotan mediante o}, ..., O, Es con- 
vencional ordenar los valores singulares de modo que 9, = 0, =+ = O, 


n 


Ejemplo 7.33 


Encuentre los valores singulares de 


Solución La matriz 


1 
1 1 

x= | olfa 
1 0 1 

0 


tiene eigenvalores A, = 3 y A, = 1. En consecuencia, los valores singulares de A son 


Vi = Via = Vh =l. | 
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multiplicación 
por A 


Figura 7.18 


Para comprender el significado de los valores singulares de una matriz A de m X n, 
considere los eigenvectores de AA. Puesto que AA es simétrica, se sabe que existe una 
base ortonormal para R” que consiste de los eigenvectores de ATA. Sea [v,,..., V,) 
una base tal que corresponde a los eigenvalores de AA, ordenados de modo que A, = A, 
=+ = Àp A partir de los cálculos justo antes de la definición, 


A; = [|Av? 
Por tanto, 0; = VA; = Av, 


En otras palabras, los valores singulares de A son las longitudes de los vectores Av,,..., 
AV. 

Geométricamente, este resultado tiene una amigable interpretación. Considere nue- 
vamente el ejemplo 7.33. Si x se encuentra sobre la circunferencia unitaria en R? (esto es 


x| = 1), entonces 


[Axl 


(Ax) - (Ax) = (Ax)"(Ax) = x"ATAx 


2 1[x j 5 

= [xi x>] = 2x1 + 2x,%, + 2x3 
1 2]lx 

que se reconoce como una forma cuadrática. Por el Teorema 5.25, los valores máximo y 

mínimo de esta forma cuadrática, sujetos a la restricción, ||x|| = 1, son A, =3yA,= 1, 

respectivamente, y se presentan en los correspondientes eigenvectores de ATA; esto es, 


Ms E e 


cuando E = yj = , YES ectivamente. Puesto que 
5 Ene el P q 


|Av;l? Ss v¡A"Av, = A; 


para į = 1,2, se ve que 0, = [Av | = v3 y 0, = [Aval] = 1 son los valores máximo 
y mínimo de las longitudes | AXI| conforme x recorre la circunferencia unitaria en R?. 
Ahora, la transformación lineal que corresponde a A mapea R? sobre el plano en R? 
con ecuación x — y — z = 0 (verifique esto), y la imagen de la circunferencia unitaria 
bajo esta transformación es una elipse que se encuentra en este plano. (Dentro de poco 
se verificará este hecho en general; vea la figura 7.18.) De modo que g, y a, son las longitu- 
des de la mitad de los ejes mayor y menor de esta elipse, como se muestra en la figura 7.19. 
Ahora es posible describir la descomposición de valor singular de una matriz. 


v 
EE 


La matriz A transforma la circunferencia unitaria en R? en una elipse en R°. Figura 7.19 
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La descomposición de valor singular 
Se quiere demostrar que una matriz A de m X n puede factorizarse como 
A=UXV” 


donde U es una matriz ortogonal de m X m, V es una matriz ortogonal de n X ny 2 es 
una matriz “diagonal” de m X n. Si los valores singulares distintos de cero de A son 


0,=0,=""=0,>0 


YO, = 0,4, == 0,=0, entonces 2 tendrá la forma de bloque 
o 2 a e 0 
5 = ei". dond == n j 1 
ol je A ds 
0 we 


y cada matriz O es una matriz cero del tamaño adecuado. (Sir = m o r = n, alguna de 
éstas no aparecerá.) Algunos ejemplos de tal matriz 2 con r = 2 son 


400 2 0 8 0 0 
z=] Sala) zajo soj S= 
0 3 0 
0 0 0 0 0 


S O 
D O u o 
S O OOG 


(¿Cuál es D en cada caso?) 

Para construir la matriz ortogonal V, primero encuentre una base ortonormal 
[v,, - - -> v,) para R” que consiste de eigenvectores de la matriz simétrica AA de n X n. 
Entonces 


V= [vi ods v,,] 


es una matriz ortogonal de n X n. 

Para la matriz ortogonal U, note primero que [Av,,..., Av,) es un conjunto ortogo- 
nal de vectores en R”. Para ver esto, suponga que v; es el eigenvector de ATA correspon- 
diente al eigenvalor A, Entonces, parai + j, se tiene 


z T 
= vj AAV; 
= viy 
dado que los eigenvectores v; son ortogonales. Ahora recuerde que los valores singulares 
satisfacen o; = ||Av;|| y que los primeros r de éstos son distintos de cero. Por tanto, puede 
normalizar Av}, . . . , Av, al establecer 
1 a 
u; = — Av; para i = 1,...,r 
a; 
Esto garantiza que {u}, . . . , u,} es un conjunto ortonormal en R”, pero si r < m no será 
una base para R”. En este caso, se extiende el conjunto {u}, . . . , u,} a una base ortonor- 
mal (u,,...,u,,) para R”. (Esta es la única parte complicada de la construcción; en los 


ejemplos siguientes y en los ejercicios se describirán técnicas para realizarla.) Entonces 
se establece 


U= [u ia u, ] 
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Todo lo que resta por demostrar es que esto funciona; es decir, es necesario verificar 
que con U, V y È como se describieron, se tiene A = UEV". Puesto que V” = V` !, esto 
equivale a demostrar que 


AV = UÈ 
Se sabe que Av; =0m, parai = l,...,r 
y [Av;]| = 0, = 0 parai =r + 1,...,n. En consecuencia, 
Av; =0 parai=r+1,...,n 
Por tanto, AV=Alw uv, 
= [Av ... Av,,] 
= [Av, Av, 0 0] 
= |ou ou, 0 0] 
O; 0: 
] : O) 
= ju u y 
de Ta 
O 0 


UÈ 


como se requería. 
Acaba de demostrarse el siguiente teorema extremadamente importante. 


Teorema 7.13 


La descomposición de valor singular 


Sea A una matriz de m X n con valores singulares o) = o, = =: = 0o, > 0y 
O = 0,4, == o, = 0. Entonces existe una matriz ortogonal U de m X m, una 
matriz ortogonal V de n X n y una matriz 2 de m X n de la forma que se muestra en 


la ecuación (1) tal que 


AS UNS" 


Una factorización de A como en el Teorema 7.13 se llama descomposición de valor 
singular (DVS) de A. Las columnas de U se llaman vectores singulares izquierdos de A, 
y las columnas de V se llaman vectores singulares derechos de A. Las matrices U y V no 
están determinadas exclusivamente por A, sino que 2 debe contener los valores singula- 
res de A, como en la ecuación (1). (Vea el ejercicio 25.) 


Ejemplo 7.34 


Encuentre una descomposición de valor singular para las siguientes matrices: 
1 1 


1 1 0 
wal A °] (b) A=|1 0 
0 1 
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Solución (a) Calcule 


y descubra que sus eigenvalores son A, = 2,4, = 1 y A, = 0, con sus correspondientes ei- 
genvectores 


1 0 =l 
Ti 0l; 1 
0 1 0 


(Verifique esto.) Estos vectores son ortogonales, de modo que se les normaliza para ob- 
tener 


1/ V2 0 =1/V2 
v1=|1/V2 |, v=|0|, v= 1/2. 
0 1 0 


Los valores singulares de A son a, = V2, 0, = V1 = 1,y 0, = VO = 0. Por tanto, 


1/V2 0 =1/V2 
2 0 
V=|1/V2 0 1/72 y ss i j 
0 1 0 
Para encontrar U, calcule 
1 111. 1 0 1/v2 1 
= AM = 75 1/V2 | = 
u= alo 0 A pe Lo 
0 
La EN 1 a i H 
i = AV), =— = 
y ea aloo al, 1 


Estos dichos vectores ya forman una base ortonormal (la base estándar) para R?, así que 
se tiene 


2 
U = 
0 1 
Esto produce la DVS 
1 1 0 Laaa NW 
4=lo o al lo lo 1 oll 2 O ió 
-1/V2 1/V2 0 


que puede comprobarse fácilmente. (Note que V tiene que ser transpuesta. Note tam- 
bién que el valor singular a, no aparece en 2.) 
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(b) Esta es la matriz del ejemplo 7.33, así que ya se sabe que los valores singulares son 


Na o E 


a, = V3 y 0, = 1, lo que corresponde a v, = Pa ~! De modo 


que 


slo al y ve[Y Y 192 
= Y VSIV yv 
0 0 
Para U, calcule 
1 1l 2/V6 
u = Av = -5 1 0 P = | 1/6 
! 1 1/V6 
1 0 

1 1 =1/Y2 
E. — miss 
de Loa yva 1/V2 


Esta vez es necesario extender {u}, u,) a una base ortonormal para RÌ. Existen varias 
formas de proceder; un método es usar el proceso de Gram-Schmidt, como en el ejem- 
plo 5.14. Primero es necesario encontrar un conjunto linealmente independiente de tres 
vectores que contengan a u, y u,. Si e, es el tercer vector base estándar en R?, es claro que 
fu, u, es) es linealmente independiente. (Aquí debe determinar esto por inspección, 
pero un método confiable para usar en general es reducir por renglón la matriz con di- 
chos vectores como sus columnas y usar el teorema fundamental.) Al aplicar Gram-Sch- 
midt (con normalización) a {u}, u, e,) (sólo es necesario el último paso), se encuentra 


—1/V3 
u, = 1/V3 
1/V3 


2/V6 0 —1/V3 
de modo que U=|1/V6 -1/V2 1/73 
1/ V6 Y. 1/73 


y se tiene la DVS 


1 1 2/V6 0 -1/V43 || v3 
A=|1 0|=|1/V6 -1/V2 1/73 
0 1 


|= vzv 
1/ V6  1/V2  1/v3 


sl 


Existe otra forma de la descomposición de valor singular, análoga a la descomposi- 
ción espectral de una matriz simétrica. Se obtiene a partir de la DVS mediante una ex- 
pansión por producto externo y es muy útil en las aplicaciones. Puede obtener esta ver- 
sión de la DVS al imitar lo que se hizo para obtener la descomposición espectral. 


+ VZ 1/V2 
0 


y -1/V2 1/V2 
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En concordancia, se tiene 


dy 
A= UJV = [u pai u,n] a 
vi 
vA 
i vV 
= [u 2 0, Upya cae 
Vi+1 
Va 
T o l| v vla 
= [u u,] + [u u,J[0]| : 
0 O, v v 
O 0 vf 
m [u u,] : 
0 a, Lv, 
vi 
= [ou ini c,u,] : 
v 


= ouv? E gay 


al usar la multiplicación en bloque y la representación columna-renglón del producto. El 
siguiente teorema resume el proceso para obtener esta forma de producto externo de la 
DVS. 


Teorema 7.14 La forma de producto externo de la DVS 


Sea A una matriz de m X n con valores singulares o} = o, =*= o, > 0yo, = 


T, == o, = 0. Sean u}, . . . , u, vectores singulares izquierdos y sean V}, . . . , V, 
vectores singulares derechos de A que corresponden a dichos valores singulares. En- 
tonces 


= os T 
A = omv +: + ouy, 


Comentario Si A es una matriz simétrica positiva definida, entonces los Teoremas 
7.13 y 7.14 se reducen a resultados que ya se conocen. En este caso, no es difícil demos- 
trar que la DVS generaliza el teorema espectral y que el Teorema 7.14 generaliza la des- 
composición espectral. (Vea el ejercicio 27.) 

La DVS de una matriz A contiene mucha información importante acerca de A, como 
se destaca en el Teorema 7.15, que es crucial. 
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Teorema 1.15 


Sea A = UÈ V” una descomposición de valor singular de una matriz A de m X n. Sean 
9 ,,...,0,todos los valores singulares distintos de cero de A. Entonces: 


a. El rank de A esr. 


b. (u,...,u,) es una base ortonormal para col(A). 

c. (u,,; ...,u,, | es una base ortonormal para nulo(A? ). 
d. {v}... v,) es una base ortonormal para renglón(A). 
e. [W,,¡-..> V,) es una base ortonormal para nulo(A). 


Demostración (a) Por el ejercicio 61 de la sección 3.5, se tiene 


rank(A) = rank(U2V”) 
= rank(3V”) 
= rank(2) =r 
(b) Ya se sabe que [u,,...,u,) es un conjunto ortonormal. Por tanto, es linealmente in- 
dependiente, por el Teorema 5.1. Puesto que u; = (1/0;)Av; para i = 1,...,r, cada u; está 


en el espacio columna de A. (¿Por qué?) Más aún, 
r = rank(A) = dim(col(A)) 


Por tanto, {u}, . . . , u,} es una base ortonormal para col(A), por el Teorema 6.10(c). 

(c) Dado que {u}, . . . , u„} es una base ortonormal para R” y {u}, . . . , u,} es una base 
para col(A), por la propiedad (b), se tiene que [u,,;,... , u,,) es una base ortonormal 
para el complemento ortogonal de col(A). Pero (col(A))+ = nulo(A* ) por el Teorema 
5.10. 


(e) Dado que 


AV,+1 T AV, =0 
el conjunto (v,, ¡, ..., v,) es un conjunto ortonormal contenido en el espacio nulo de A. 
Por tanto, [v,,;,..., v,) es un conjunto linealmente independiente de n — r vectores en 


nulo(A). Pero 
dim(nulo(A)) = n-r 


por el teorema del rank, de modo que {V} . . ., v,) es una base ortonormal para 
nulo(A), por el Teorema 6.10(c). 


(d) La propiedad (d) surge de la propiedad (e) y el Teorema 5.10. (En el ejercicio 32 se 
le pide probar esto.) — 


La DVS ofrece nueva comprensión geométrica acerca del efecto de las transforma- 
ciones matriciales. Muchas veces se hizo notar (sin demostración) que una matriz de 
m X n transforma la esfera unitaria en R” en un elipsoide en R”. Este tema surge, por 
ejemplo, en las discusiones del teorema de Perron y de los operadores norma, así como 
en la introducción a los valores singulares en esta sección. Ahora se demostrará este re- 
sultado. 
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Teorema 7.16 


Sea A una matriz de m X n con rank r. Entonces la imagen de la esfera unitaria en R” 
bajo la transformación matricial que mapea x a Ax es 


a. la superficie de un elipsoide en R” sir = n. 
b. un elipsoide sólido en R” sir < n. 


Demostración Sea A = UEV” una descomposición de valor singular de la matriz A de 
m X n. Sean los vectores singulares izquierdo y derecho de A u4, . . . , U, Y Vi ++. > Vp res- 
pectivamente. Puesto que rank(A) = r, los valores singulares de A satisfacen 


o=o: =o, >00 Y Om = Omp = = 0O 
X 
por el Teorema 7.15(a). Sea x = | : | un vector unitario en R”. Ahora, puesto que V es 
x 


n 


una matriz ortogonal, también lo es V”, y en consecuencia V*x es un vector unitario, por 
el Teorema 5.6. Ahora 


vi vix 
Vx=|:lx= : 
T T, 

vi v,X 


de modo que (v? x)? +- + (vT x}? = 1. 
Por la forma de producto exterior de la DVS, se tiene A = ouvi Pona ouv? Pot 
tanto, 


Ax = OU VIX + + 0 uvIx 
= (ovix)u, ++ + (0,v1x)u, 
= yı PASE y qu, 
donde y; denota al escalar o v!x. 
(a) Si r = n, entonces se debe tener n <= m y 
Ax = yu ENE y 4, 
Uy 


Y 
donde y = | : |. Por tanto, nuevamente por el Teorema 5.6, Ax = | Uy]| = llyl], pues 


Yn 
U es ortogonal. Pero 


(2) peig (2) = (vix) +: + (vix =1 


(O On 


lo que demuestra que los vectores Ax forman la superficie de un elipsoide en R”. (¿Por 
qué?) 


(b) Sir < n, la única diferencia en los pasos anteriores es que la ecuación se convierte en 


2 2 
(2) POES (2) er 
T T, 
pues faltan algunos términos. Esta desigualdad corresponde a un elipsoide sólido en R”. 
— T 
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Ejemplo 7.35 


> 
Describa la imagen de la esfera unitaria en R? bajo la acción de la matriz 
1 1 0 
A= 
0 0 1 


Solución En el ejemplo 7.34(a) se encontró la siguiente DVS de A: 


Me Eo id DE 
0 0 1 o Lo 1 Uaa yA o 


Puesto que r = rank(A) = 2 < 3 = n, se aplica la segunda parte del Teorema 7.16. La 
imagen de la esfera unitaria satisfará la desigualdad 


2 2 2 
E e 


en relación con los ejes coordenados yy, en R? (correspondientes a los vectores singula- 
res izquierdos u, y wu). Dado que u; = e, y u, = e), la imagen es como se muestra en la 
figura 7.20. 


Figura 7.20 


En general, es posible describir el efecto de una matriz A de m X n sobre la esfera 

unitaria en R” en términos del efecto de cada factor en su DVS, A = UXV”, de derecha 
a izquierda. Puesto que V” es una matriz ortogonal, mapea la esfera unitaria en sí misma. 
La matriz 2 de m X n hace dos cosas: las entradas diagonales 0”, ,, = C, =*":*=0, 
0 colapsan n — r de las dimensiones de la esfera unitaria, lo que deja una esfera unitaria 
r-dimensional, que entonces las entradas diagonales distintas de cero ©}, . . . , dr, distor- 
sionan en un elipsoide. Entonces la matriz ortogonal U alinea los ejes de este elipsoide 
con los vectores base ortonormales u,,...,u, en R”. (Vea la figura 7.21.) 


La descomposición de valor singular es una herramienta extremadamente útil, tanto 
práctica como teóricamente. Se observarán sólo algunas de sus muchas aplicaciones. 


Sección 7.4 La descomposición de valor singular 623 


Figura 7.21 


Rank Hasta el momento no ha tenido que preocuparse por calcular el rank de una 
matriz desde un punto de vista computacional. El rank de una matriz se calcula al redu- 
cirla por renglones a la forma escalonada y a contar el número de renglones distintos de 
cero. Sin embargo, como ha visto, los errores de redondeo pueden afectar este proceso, 
en especial si la matriz está mal condicionada. Las entradas que deben ser cero pueden 
terminar como números distintos de cero muy pequeños, lo que afecta la capacidad para 
determinar con precisión el rank y otras cantidades asociadas con la matriz. En la prác- 
tica, con frecuencia se usa la DVS para encontrar el rank de una matriz, pues es mucho 
más confiable cuando se presentan errores de redondeo. La idea básica detrás de este en- 
foque es que las matrices ortogonales U y V en la DVS preservan las longitudes y por 
tanto no introducen errores adicionales; cualquier error que ocurra tenderá a mostrarse 
en la matriz 2. 


A = 
CAS Ejemplo 7.36 


8.1650 —0.0041 —0.0041 8.17 0 0 
A = | 4.0825 —3.9960 4.0042 y B=|408 —4 4 
4.0825 4.0042 —3.9960 4.08 4 —4 


La matriz B se obtuvo mediante redondeo de las entradas en A a dos lugares decimales. 
Si calcula los ranks de estas dos matrices aproximadamente iguales, se encuentra que 
rank(A) = 3, pero rank(B) = 2. Por el teorema fundamental, esto implica, entre otras 
cosas, que A es invertible, pero B no lo es. 

La explicación para esta diferencia crucial entre dos matrices que son aproximada- 
mente iguales se encuentra en su DVS. Los valores singulares de A son 10, 8 y 0.01, de 
modo que A tiene rank 3. Los valores singulares de B son 10, 8 y 0, de modo que B tiene 
rank 2. 

En aplicaciones prácticas, con frecuencia se supone que si un valor singular se calcula 
cercano a cero, entonces se arrastra error de redondeo y el valor real debe ser cero. De 
esta forma, puede filtrarse el “ruido”. En este ejemplo, si calcula A = UV? y sustituye 


10 0 0 10 0 0 
2=|0380 por *'=| 0 8 0 
0 0 0.01 0 0 0 
»—> entonces U2'V? = B. (¡Inténtelo!) | 


Normas matriciales y el número de condición La DVS puede proporcionar fórmu- 
las simples para ciertas expresiones que involucran normas matriciales. Considere, por 
ejemplo, la norma de Frobenius de una matriz. El siguiente teorema demuestra que está 
completamente determinada por los valores singulares de la matriz. 
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Teorema 1.17 


Sea A una matriz de m X n y sean 9, ..., 0,todos los valores singulares distintos de 
cero de A. Entonces 


[Alla = Wo +0 


La demostración de este resultado depende de la siguiente analogía del Teorema 5.6: 


Si A es una matriz de m X n y Q es una matriz ortogonal de m X 77, entonces 


IQAl|+ = |All: (2) 


Para demostrar que esto es cierto, calcule 
[QA]? = [Qa, ++ Qa,]ll; 
= Qail + >> + Qali 
= jalg + + a, ll 
= |A|; 
Demostración del Teorema 7.17 Sea A = UV? una descomposición de valor singular 
de A. Entonces, al usar la ecuación (2) dos veces, se tiene 
[Al = UZV"; 
= [2v7] = (2v5; 
= VZ = S= H +02 


que establece el resultado. B) 


cas Ejemplo 7.37 


Verifique el Teorema 7.17 para la matriz A en el ejemplo 7.18. 


r ; 3 . ; 
Solución La matriz A = | 1] tiene valores singulares 4.5150 y 3.1008. Se com- 


2 


prueba que 


V4.5150? + 3.1008? = V30 = |Al|, 
que concuerda con el ejemplo 7.18. | 
En la sección 7.2 se comentó que no hay una fórmula sencilla para el operador 2- 


norma de una matriz A. Aunque esto es cierto, la DVS de A proporciona una expresión 
muy amigable para [| Al|,. Recuerde que 


|All: = máx Axl] 


Įx|=1 


donde la norma vectorial es la norma euclidiana ordinaria. Por el Teorema 7.16, para 
|x| = 1, el conjunto de vectores ||Ax|| yace en o dentro de un elipsoide cuyos semiejes 
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tienen longitudes iguales a los valores singulares de A distintos de cero. Se tiene inme- 
diatamente que el más grande de ellos es o}, de modo que 


Al, = 0, 


Esto proporciona una manera elegante de expresar el número de condición de una 
matriz (cuadrada) con respeto al operador 2-norma. Recuerde que el número de condi- 
ción (con respecto al operador 2-norma) de una matriz invertible A se define como 


cond(A) = |A™' hA] 


Como se le pedirá demostrar en el ejercicio 28, si A = UÈ V”, entonces A™! = VE !U?, 
Por tanto, los valores singulares de A7* son 1/0}... , 1/0, (¿por qué?) y 


o, == 1/0, 


Se tiene que | A~], = 1/0, de modo que 


cond,(A) = 2 


n 


Ejemplo 7.38 


E. H. Moore (1862-1932) fue un 
matemático estadounidense que tra- 
bajó en teoría de grupos, teoría de 
números y geometría. Fue el primer 
director del departamento de 
matemáticas de la Universidad de 
Chicago cuando abrió en 1892. En 
1920 introdujo una matriz genera- 
lizada inversa que incluyó matrices 
rectangulares. Su obra no recibió 
mucha atención debido a su oscuro 
estilo de escritura. 


Encuentre el número de condición 2 de la matriz A en el ejemplo 7.36. 


Solución Dado que a, = 10 y a, = 0.01, 


T; 10 
cond,(A) = pe = ToL = 1000 
3 : 


Este valor es suficientemente grande para sugerir que A puede estar mal condicionada y 
debe estar alerta del efecto de los errores de redondeo. | 


La pseudoinversa y la aproximación por mínimos cuadrados En la sección 7.3 se 
produjo la fórmula A* = (A7A)!A” para la pseudoinversa de una matriz A. Clara- 
mente, esta fórmula sólo es válida si ATA es invertible, como se hizo notar en su mo- 
mento. Equipado con la DVS, ahora puede definir la pseudoinversa de cualquier matriz 
y generalizar la fórmula anterior. 


Definición Sea A = UV? una DVS para una matriz A de m X n, donde È = 


D O : E ; 
E A y D es una matriz diagonal de r X r que contiene los valores singulares dis- 


tintos de cero o} = 0, = ++: = g, > 0 de A. La pseudoinversa (o inversa de Moore- 
Penrose) de A es la matriz A” de n X m definida por 


A* =VE0A 

donde È* es la matriz de n X m 
T 
O O 
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>> 
Ejemplo 7.39 Encuentre las pseudoinversas de las matrices del ejemplo 7.34. 
Solución (a) A partir de la DVS 
1/ V2 112 0 
asio S A m 
=1/V2 1/V2 0 
se forma 
1/ V2 0 
2*=| 0 1 
0 0 
Entonces 
o A o0 E 1/2 0 
A% = VĒE*UT = | 1/V2 0 142 0 rl | = 1/2 0 
0 1 0 0 0 0 1 
(b) Se tiene la DVS 
1 1 2/6 0 -1/V3]|[ v3 0 
A=|1 0|=|1/V6 -1/42  1/vV3|| 0 E Dyal = uzv" 
o 1 1/V6 1v2  1/V3JL 0 0 
de modo que as R o] 
0 1.0 
y 
2 1 1 
e s._[yvi vaya o o YV6 ve yvS 
A a wal o 10 —1/V2 1/2 
-1/3 1/73 1/73 


Uno de los que estuvo al tanto del 
trabajo de Moore acerca de los in- 
versos matriciales fue Roger Penrose 
(n. 1931), quien introdujo su propia 
noción de un inverso matricial ge- 
neralizado en 1955. Penrose hizo 
muchas aportaciones a la geometría 
y la física teórica. También es el in- 
ventor de un tipo de mosaico no pe- 
riódico que cubre el plano sólo con 
dos formas diferentes de mosaico, 
pero no tiene patrón. Recibió mu- 
chos premios, incluido el Premio 
Wolf de Física en 1988, que compar- 
tió con Stephen Hawking. En 1994 
fue nombrado caballero por sus ser- 
vicios a la ciencia. Sir Roger Penrose 
es en la actualidad profesor emérito 
Rouse Ball de matemáticas en la 
Universidad de Oxford. 


e 2/3 ES] 
o [1/33 -1/3 2/3 


PE 


Es directo comprobar que esta nueva definición de la pseudoinversa generaliza la an- 
terior, pues si la matriz de A = UEV” m X n tiene columnas linealmente independien- 
tes, entonces la sustitución directa muestra que (474) 141= V3*U”. (En el ejercicio 50 
se le pide verificar esto.) En los ejercicios se exploran otras propiedades de la pseudoin- 
versa. 

Se vio que cuando A tiene columnas linealmente independientes, existe una solución 
única x de mínimos cuadrados para Ax = b; esto es, las ecuaciones normales ATAx = 
A?b tienen la solución única 


x = (AA) Ab = A*b 


Cuando las columnas de A son linealmente dependientes, entonces ATA no es invertible, 
de modo que las ecuaciones normales tienen infinitas soluciones. En este caso, se pedirá 
la solución x de longitud mínima (es decir, la más cercana al origen). Es evidente que esta 
vez simplemente se usa la versión general de la pseudoinversa. 
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Teorema 1.18 


El problema de mínimos cuadrados Ax = b tiene una solución única x de mínimos 
cuadrados de longitud mínima que está dada por 
x= A'b 


Demostración Sea A una matriz de m X n de rank r con DVS: A = UNV* (de modo 
que A* = VE*U” ). Sean y = V*x y e = Ub. Escriba y y c en forma de bloque como 


llo bs 
Y C2 
donde y, y c, están en RR”. 


Se quiere minimizar |b — Ax|| o, de manera equivalente, |b — Ax/]?. Al usar el Teo- 
rema 5.6 y el hecho de que U" es ortogonal (porque U lo es), se tiene 


|b — Ax]? = [U*(b — Ax)? = [Ub — UZV*x)|? = |U*b — UTUZ V”xl|? 


2 
ai lala lr IE 
Cc, O ojiy C 


La única parte de esta expresión sobre la que se tiene control es y}, de modo que el valor 
mínimo ocurre cuando c, — Dy, = 0 o, de manera equivalente, cuando y, = D”'c,. De 
modo que todas las soluciones x de mínimos cuadrados son de la forma 


2 


De, 
x=Vy=V 
y2 
Dr! 
Establezca x=Vy= v| a 


Se afirma que esta x es la solución de mínimos cuadrados de longitud mínima. Para de- 
mostrar esto, suponga que 


P'a] 


x= w =v] š 
2 


es una solución diferente de mínimos cuadrados (por tanto, y, + 0). Entonces 


Ixi = vyl = Iyi < ly = Ivy = [pe 


como se afirmó. 
Todavía debe demostrar que x es igual a A* b. Para hacerlo, simplemente calcule 


lo alla, 
x=Vy=V = V 
0 oOo ollo 
= VE*c = VE*UTb = Ab 
— A 


> 


Ejemplo 7.40 


Encuentre la solución de mínimos cuadrados de longitud mínima para Ax = b, donde 


a A S 
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Solución Las ecuaciones correspondientes 

x+y=0 

x+y=1 
claramente son inconsistentes, de modo que la solución de mínimos cuadrados es la 
única esperanza. Más aún, las columnas de A son linealmente dependientes, de modo 


que habrá infinitas soluciones de mínimos cuadrados, entre las cuales se quiere aquella 
con longitud mínima. 


Una DVS de A está dada por 
a-l dle mal ela e 
ooaj l1i/v2 =1/v2]lo ojl1iyv2 -1/v2] 


(Verifique esto.) Se tiene que 


1/V2  1/72|[1/2 «lia 1/72 1/4 1/4 
1/ V2 E o JT al 


1) La 
Puede ver que la solución mínima de mínimos cuadrados del ejemplo 7.40 satisface 
x + y = 3. En cierto sentido, este es un compromiso entre las dos ecuaciones con las que 


se comenzó. En el ejercicio 49 se le pide resolver directamente las ecuaciones normales 
para este problema y verificar que esta solución realmente es la más cercana al origen. 


A= VE*U” = | 


de modo que 


El teorema fundamental de las matrices invertibles Es adecuado concluir con la re- 
visión, una vez más, del teorema fundamental de las matrices invertibles. No es de sor- 
prender que los valores singulares de una matriz cuadrada digan cuándo la matriz es in- 
vertible. 


Teorema 7.19 


El teorema fundamental de las matrices invertibles: versión final 


Sea A una matriz de n X n y sea T: V—> W una transformación lineal cuya matriz 
[T]¿._g con respecto a las bases B y C de V y W, respectivamente, es A. Los siguientes 
enunciados son equivalentes: 


. A es invertible. 

Ax = b tiene una solución única para toda b en R” 

Ax = 0 sólo tiene la solución trivial. 

. La forma escalonada reducida por renglón de A es I,. 

A es un producto de matrices elementales. 

rank(A) = n 

. nulidad(A4) = 0 

. Los vectores columna de A son linealmente independientes. 
Los vectores columna de A generan a R”. 

Los vectores columna de A forman una base para R”. 

. Los vectores renglón de A son linealmente independientes. 
Los vectores renglón de A generan a R”. 


— AAA AO Ap Tp 
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m. Los vectores renglón de A forman una base para R”. 
n. det A #0 

o. 0 no es un eigenvalor de A. 
p. T es invertible. 
q. T es uno a uno. 
r. Tes sobreyectiva. 

s. ker(T) = {0} 

t. Rango (1) = W 

u. 0 no es un valor singular de A. 


Demostración Note primero que, por la definición de valores singulares, 0 es un valor 
singular de A si y sólo si O es un eigenvalor de A”A. 

(a) => (u) Si A es invertible, también lo es A”, y por tanto también lo es AA. Por tanto, 
la propiedad (o) implica que 0 no es un eigenvalor de ATA, de modo que 0 no es un valor 
singular de A. 

(u) = (a) Si 0 no es un valor singular de A, entonces 0 no es un eigenvalor de ATA. En 
consecuencia, AA es invertible, por la equivalencia de las propiedades (a) y (o). Pero en- 
tonces rank(A) = n, por el Teorema 3.28, de modo que A es invertible, por la equivalen- 
cia de las propiedades (a) y (f). — Y 


O Bettmann/CORBIS 


Figura 7.22 
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Entre las muchas aplicaciones de la DVS, una de las más impresionantes es su uso en la 
compresión de imágenes digitales, de modo que puedan transmitirse electrónicamente 
con eficiencia (por satélite, fax, Internet o similares). Ya se analizó el problema de detec- 
tar y corregir errores en tales transmisiones. El problema que ahora se quiere considerar 
tiene que ver con la reducción de la cantidad de información que debe transmitirse sin 
perder información esencial. 

En el caso de las imágenes digitales, suponga que tiene una imagen en escala de gri- 
ses con un tamaño de 340 X 280 píxeles. Cada píxel es una de los 256 tonos de gris, que 
pueden representarse mediante un número entre 0 y 255. Esta información se puede al- 
macenar en una matriz A 340 X 280, pero transmitir y manipular estos 95,200 núme- 
ros es muy costoso. La idea detrás de la compresión de imágenes es que algunas partes de 
la imagen son menos interesantes que otras. Por ejemplo, en una fotografía de alguien de 
pie en exteriores, puede haber mucho cielo en el fondo, mientras que el rostro de la per- 
sona contiene muchos detalles. Probablemente podría transmitir cada segundo o tercer 
píxel en el fondo, pero le gustaría mantener todos los píxeles en la región del rostro. 

Es evidente que los pequeños valores singulares en la DVS de la matriz A provienen 
de las partes “aburridas” de la imagen, y puede ignorar muchas de ellas. Suponga, enton- 
ces, que tiene la DVS de A en forma de producto externo 


A = ouv? +: + ouvi 


Sea k <= r y defina A; = 0 Uv, +- + opui 


Entonces A, es una aproximación de A que corresponde a mantener sólo los primeros k 
valores singulares y los correspondientes vectores singulares. Para el ejemplo de 340 X 
280, puede descubrir que es suficiente con transmitir sólo los datos correspondientes a 
los primeros 20 valores singulares. Entonces, en lugar de transmitir 95,200 números, 
sólo es necesario enviar 20 valores singulares más los 20 vectores u, . . . , u, en RY y los 
20 vectores V, ....., vz en R% para un total de 


20 + 20:340 + 20-280 = 12,420 


números. ¡Esto representa un ahorro sustancial! 


La imagen del matemático Gauss en la figura 7.22 es una imagen de 340 X 280 pí- 
xeles. Tiene 256 tonos de gris, de modo que la matriz correspondiente A tiene 340 X 
280, con entradas entre 0 y 255. 

Es evidente que la matriz A tiene rank 280. Si aproxima A mediante A, como se des- 
cribió líneas arriba, se obtiene una imagen que corresponde a los primeros k valores sin- 
gulares de A. La figura 7.23 muestra varias de estas imágenes para valores de k de 2 a 256. 
Al principio, la imagen es muy borrosa, pero muy rápidamente adquiere forma. Note 
que A,, ya produce una aproximación bastante buena de la imagen real (que proviene de 
A = Agp» como se muestra en la esquina superior izquierda de la figura 7.23). 

Algunos de los valores singulares de A son a, = 49,096, o = 22,589, o}, = 10,187, 
Tg, = 484, 0 175 = 182, 0,5 = 5 y Cago = 0.5. Los valores singulares más pequeños contri- 
buyen muy poco a la imagen, razón por la cual las aproximaciones rápidamente parecen 
tan cercanas al original. 


Orignial, k = r = 280 


k=16 


k = 64 k = 128 k= 256 


el 
fa] 
[a 
S 
2 
e 
S 
È 
S 
E 
E 
D 
[ea] 
© 


Figura 7.23 
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Ejercicios 1.4 


Y 


En los ejercicios 1-10, encuentre los valores singulares de la 
matriz dada. 


2 0 [3 1 
a saafi 
o 3 1 3 
1 1l [V2 1 
edl aa 
o 0 0 v2 
[3 
5.A = | 6 A=[3 4] 
|4 
0 0 1 0 
7.A=| 0 3 8. A4A=| 0 1 
22.0 =2 2 
1 0 1 
2 0 1 
sa =| | 10. A=|0 -3 0 
0.2.0 
1 0 1 


En los ejercicios 11-20, encuentre una DVS de la matriz indi- 


cada. 
ETI =2 0 
11. A en el ejercicio 3 12.4 = | ô | 


0 

0 =2 L =I 

aa i t 
=3 0 1 1 


15. A en el ejercicio 5 16. A en el ejercicio 6 


17. A en el ejercicio 7 18. A en el ejercicio 8 


E a 
mafii 


19. A en el ejercicio 9 
1 1 1 


En los ejercicios 21-24, encuentre la forma de producto ex- 
terno de la DVS para la matriz en los ejercicios dados. 


21. Ejercicios 3 y 11 22. Ejercicios 14 


23. Ejercicios 7 y 17 24. Ejercicios 9 y 19 


25. Demuestre que las matrices U y V en la DVS no están 
determinadas de manera única. [Sugerencia: encuentre 
un ejemplo en el que sería posible hacer diferentes elec- 
ciones en la construcción de dichas matrices. ] 


26. Sea A una matriz simétrica. Demuestre que los valores 
singulares de A son: 
(a) los valores absolutos de los eigenvalores de A. 
(b) los eigenvalores de A si A es definida positiva. 


27. (a) Demuestre que para una matriz simétrica A 
definida positiva, el Teorema 7.13 produce la diago- 
nalización ortogonal de A, como garantiza el teo- 
rema espectral. 


> 


(b) Demuestre que, para una matriz simétrica A definida 
positiva, el Teorema 7.14 produce la descomposición 


espectral de A. 
28. Si A es una matriz invertible con DVS: A = UÈ V”, de- 
muestre que Y es invertible y que A7! = V21U? es 


una DVS de A? 


29. Demuestre que si A = UÈ V” es una DVS de A, enton- 
ces los vectores singulares izquierdos son eigenvectores 
de AA". 

30. Demuestre que A y A? tienen los mismos valores singu- 
lares. 

31. Sea Q una matriz ortogonal tal que QA tiene sentido. 
Demuestre que A y QA tienen los mismos valores singu- 
lares. 


32. Demuestre el Teorema 7.15(d). 


33. ¿Cuál es la imagen del círculo unitario en R? bajo la ac- 
ción de la matriz en el ejercicio 3? 


34. ¿Cuál es la imagen del círculo unitario en R’? bajo la ac- 
ción de la matriz en el ejercicio 7? 


35. ¿Cuál es la imagen de la esfera unitaria en R? bajo la ac- 
ción de la matriz en el ejercicio 9? 


36. ¿Cuál es la imagen de la esfera unitaria en R? bajo la ac- 
ción de la matriz en el ejercicio 10? 


En los ejercicios 37-40, calcule (a) || A||, y (b) cond,(A) para la 
matriz indicada. 


37. A en el ejercicio 3 
1 J 
1 1 


38. A en el ejercicio 8 


10 10 0 
wae 00] 
100 100 1 


39.A = | 
En los ejercicios 41-44, calcule la pseudoinversa A* de A en el 


ejercicio dado. 
41. Ejercicio 3 42. Ejercicio 8 


43. Ejercicio 9 44. Ejercicio 10 


En los ejercicios 45-48, encuentre A* y úsela para calcular la 
solución de mínimos cuadrados de longitud mínima para 


Ax =b. 
1 2 
ol 
2 4 5 
3050 3 
saf? e a-f] 
0 0 2 
1 1 1 
47.A=|1 1|b=|2 
l1 1 3 


1.0.1 1 
48.A=|0 1 0|,b=|1 
1 0O 1 1 


49. (a) Establezca y resuelva las ecuaciones normales para 
el sistema de ecuaciones en el ejemplo 7.40. 

(b) Encuentre una expresión paramétrica para la longi- 
tud de un vector solución en el inciso (a). 

(c) Encuentre el vector solución de longitud mínima y 
verifique que es el producido por el método del 
ejemplo 7.40. [Sugerencia: recuerde cómo encontrar 
las coordenadas del vértice de una parábola.] 


50. Verifique que cuando A tiene columnas linealmente 
independientes, las definiciones de pseudoinversa en 
esta sección y en la sección 7.3 son iguales. 


51. Verifique que la pseudoinversa (como se definió en esta 
sección) satisface las condiciones de Penrose para A (Teo- 
rema 7.12 en la sección 7.3). 


52. Demuestre que A* es la única matriz que satisface las 
condiciones de Penrose para A. Para hacer esto, suponga 
que A” es una matriz que satisface las condiciones de Pen- 
rose: (a) AA'A = A, (b) 4'4A'= A”, y (c) AA' y A'A son 
simétricas. Pruebe que A' = A*. [Sugerencia: use las con- 
diciones de Penrose para A* y A' para demostrar que A* 
= A'AA? y A' = A'AA*. Es útil notar que la condición 
(c) puede escribirse como AA’ = (AY AT y A'A = 
A*(A”)”, con versiones similares para A*.] 

53. Demuestre que (A*)* = A. [Sugerencia: demuestre que 
A satisface las condiciones de Penrose para A*. Por 
tanto, por el ejercicio 52, A debe ser (4*)*.] 

54. Demuestre que (A*)? = (4*)*. [Sugerencia: demuestre 
que (A? y” satisface las condiciones de Penrose para AZ, 
Por tanto, por el ejercicio 52, (A*)* debe ser (4*)*.] 

55. Demuestre que si A es una matriz simétrica idempo- 
tente, entonces A” = A. 


Aplicaciones 
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56. Sea Q una matriz ortogonal tal que QA tiene sentido. 
Demuestre que (QA)* = AQF. 

57. Demuestre que si A es una matriz definida positiva con 
DVS: A = UXV”, entonces U = V. 


58. Demuestre que para una matriz diagonal, las 1-, 2- y 
co-normas son iguales. 


59. Demuestre que para cualquier matriz cuadrada A, [|Al|% 
<= [Al ,1Al... [Sugerencia: | A|3 es el cuadrado del 
valor singular más grande de A y por tanto es igual al ei- 
genvalor más grande de AA. Ahora use el ejercicio 34 
de la sección 7.2.] 


/2=/ Todo número complejo puede escribirse en forma polar como z 


= re”, donde r = |z| es un número real no negativo y 0 es su 

argumento, con |e®| = 1. (Vea el Apéndice C.) Por tanto, z se 

descompuso en un factor de elongación r y un factor de rota- 
ción e”. Existe una descomposición análoga A = RQ para ma- 
trices cuadradas llamada descomposición polar. 

60. Demuestre que toda matriz cuadrada A puede factori- 
zarse como A = RQ, donde R es simétrica semidefinida 
positiva y Q es ortogonal. [Sugerencia: demuestre que la 
DVS puede reescribirse para producir 

A = UEV” = UX(U*U)V? = (UU*)](UV?) 


Luego demuestre que R = UU” y Q = UV” tienen 
las propiedades correctas. ] 


Encuentre una descomposición polar de las matrices en los 
ejercicios 61-64. 


61. A en el ejercicio 3 62. A en el ejercicio 14 


i 3 4 2 = 
| 3 a 64. A=| -2 2 6 
4 —1 6 


En muchas aplicaciones es necesario aproximar una función dada mediante una función 


“más amigable”. Por ejemplo, acaso quiera aproximar f(x) = e* mediante una fun- 
ción lineal g(x) = c + dx en cierto intervalo [a, b]. En este caso, se tiene una función 
continua f y se quiere aproximarla tan cercanamente como sea posible en el intervalo [a, b] 
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mediante una función g en el subespacio %,. El problema general puede parafrasearse 
del modo siguiente: 


Dada una función continua f sobre un intervalo [a, b] y un subespacio W de €[a, b], 
encuentre la función “más cercana” a fen W. 


El problema es análogo al ajuste de puntos de datos mediante mínimos cuadrados , ex- 
cepto que ahora se tienen infinitos puntos de datos, a saber: los puntos sobre la gráfica de la 
función f. ¿Qué significaría “aproximar” en este contexto? Una vez más, el teorema de mejor 
aproximación tiene la respuesta. 

La función dada fexiste en el espacio vectorial € [a, b] de funciones continuas sobre 
el intervalo [a, b]. Este es un espacio con producto interno, con el siguiente producto in- 
terno 


H8) = | nor as 


a 


Si W es un subespacio con dimensión finita de € [a, b], entonces la mejor aproximación 
afen W está dada por la proyección de f sobre W, por el Teorema 7.8. Más aún, si 
Lu, ..., u¿) es una base ortogonal para W, entonces 


Mt) wf) 


u 
(u, u) ! 


proyw(f) = 


Ejemplo 7.41 


Encuentre la mejor aproximación lineal a f(x) = e* sobre el intervalo [—1, 1]. 


Solución Las funciones lineales son polinomios de grado 1, de modo que se usa el subes- 
pacio W = P,[—1, 1] de 6 [—1, 1] con el producto interno 


1 
G= | osas 
=} 
Una base para P,[—1, 1] está dada por {1, x}. Dado que 


(L, x)= Paco 


=1 


ésta es una base ortogonal, de modo que la mejor aproximación para fen W es 


g(x) =proyu(e) = l ya 


= (e — e!) + 3e lx = 1.18 + 1.10x 


gŒ) 


fŒ) 


a 


Figura 7.25 


Sección 7.5 Aplicaciones 635 


1 
»—> donde se usó integración por partes para evaluar | xe* dx. (Compruebe estos cálculos.) 


Vea la figura 7.24. -1 


fo= ge 


g(x) = 1.18 + 1.10x 


Figura 7.24 | 


El error al aproximar f mediante g está especificado por el teorema de mejor aproxi- 
mación: la distancia |f — g| entre f y g en relación con el producto interno sobre 
€ [—1, 1]. Este error es justo 


lf=gll = y Ju — ga) de 


y con frecuencia se llama error cuadrático medio. Con la ayuda de un CAS, se descubre 
que el error cuadrático medio en el ejemplo 7.41 es 


1 
ler = Gle = e?) + 3e7!x)] = "i (e* = (e = e) = 3e"!x)? dx = 0.23 


=1 


Comentario El error cuadrático medio puede considerarse como el análogo al área 
entre las gráficas de f y g sobre el intervalo especificado. Recuerde que el área entre las 
gráficas de f y g sobre el intervalo [a, b] está dada por 


Pisto —atolas 


a 


(Vea la figura 7.25.) 


Aunque la ecuación en el comentario anterior es una medida sensible del “error” 
entre f y g, el signo de valor absoluto hace difícil trabajar con él. El error cuadrático 
medio es más fácil de usar y por tanto preferible. La raíz cuadrada es necesaria para 
“compensar” la elevación al cuadrado y mantener la unidad de medición igual como 
sería para el área entre las curvas. Para propósitos de comparación, el área entre las grá- 
ficas de f y g en el ejemplo 7.41 es 


1 
| le” — ¿(e — e) — 36 lx] dx = 0.28 


FA 
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Ejemplo 7.42 


Encuentre la mejor aproximación cuadrática a f(x) = e* sobre el intervalo [ —1, 1]. 


Solución Una función cuadrática es un polinomio de la forma g(x) = a + bx + cx? en 
W = P,[—1, 1]. Esta vez, la base estándar (1, x, x°} no es ortogonal. Sin embargo, puede 
construir una base ortogonal usando el proceso de Gram-Schmidt, como se hizo en el 
ejemplo 7.8. El resultado es el conjunto de polinomios de Legendre 


(1,x,x? — 3) 


Al usar este conjunto como la base, calcule la mejor aproximación a fen W como g(x) = 
proyw (e*). Los términos lineales en este cálculo son exactamente como en el ejemplo 
7.41, de modo que sólo se requieren los cálculos adicionales 


1 1 
ro -he-p | par | (ir haa 
-1 -1 


(l,e (xe) e 
x) = provy(e*) = 1+ + 2-1 
gl ) P Ywl ) a, 1) (x, x) (x? z= lx? a na 3) 
2 =1 
ale: = 7e 
= (e — e™') + 3e7la + A ; leë 3) 
15 
3(11e! — e 15(e — 7e7! 
= ( J ) H3e7!x + N 7 E EE Ea E 
(Vea la figura 7.26.) 
y 
A 
5] FL) =.e 


g(x) = 1.00 + 1.10x + 0.5412 


ji 
=2 -1 1 2 


Figura 7.26 


Ejemplo 7.43 
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Note cuánto mejor es la aproximación cuadrática del ejemplo 7.42 que la aproxima- 
ción lineal del ejemplo 7.41. Es evidente que, en el caso cuadrático, el error cuadrático 
medio es 


le” = gx) = yfe — g(x)) dx = 0.04 


En general, mientras más grande sea el grado del polinomio de aproximación, menor 
será el error y mejor la aproximación. 

En muchas aplicaciones, las funciones se aproximan mediante combinaciones de 
funciones seno y coseno. Este método es particularmente útil si la función por aproxi- 
mar muestra comportamiento periódico o casi periódico (como el de una onda sonora, 
un impulso eléctrico o el movimiento de un sistema en vibración). Una función de la 
forma 


p(x) = ay + a; cosx + a,cos2x ++: + a, cos nx + b, sen x a) 


+ b, sen 2x +++ + b, sen nx 


se llama polinomio trigonométrico; si a, y b, no son ambos cero, entonces se dice que 
p(x) tiene orden n. Por ejemplo, 


p(x) = 3 — cosx + sen 2x + 4sen 3x 


es un polinomio trigonométrico de orden 3. 
Centre su atención en el espacio vectorial 6 [—17, mT] con el producto interno 


e= | fosa 


=T 


Los polinomios trigonométricos de la forma en la ecuación (1) son combinaciones lineales 
del conjunto 


B = {1, cos x, . . . , COs nx, sen x,..., sen nx} 


La mejor aproximación a una función f en €[—+1r, 77] mediante un polinomio trigono- 
métrico de orden n será por tanto proyw (f), donde W = gen(B). Es evidente que B es 
un conjunto ortogonal y, por tanto, una base para W. La verificación de este hecho invo- 
lucra demostrar que cualesquiera dos funciones distintas en B son ortogonales con res- 
pecto al producto interno dado. El ejemplo 7.43 presenta algunos de los cálculos necesa- 
rios; en los ejercicios 17-19 se le pide efectuar los restantes. 


Demuestre que sen jx es ortogonal a cos kx en €[—1r, m] paraj,k= 1. 


Solución Al usar una identidad trigonométrica, calcule del modo siguiente: si j # k, 
entonces 


| 


| sen jx cos kx dx = J [sen(j + k)x + sen(j — k)x] dx 


— E —. 


ES + k)x  cos(j— k)x |” 

MANE E 
=0 

pues la función coseno es periódica con periodo 27. 
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Sij= k, entonces 


T 


1 
sen kx cos kx dx = g kx] = 0 


T 


pues sen kr = 0 para cualquier entero k. | 


Con la finalidad de encontrar la proyección ortogonal de una función fen € [—11, 71] 
sobre el subespacio W generado por la base ortogonal B, es necesario conocer los cua- 
drados de las normas de los vectores base. Por ejemplo, al usar una fórmula de ángulo 
medio, se tiene 


(sen kx, sen kx) = | sen? kx dx 


== 


= 3 (1 — cos 2kx) dx 
l enake) 
y = 
2k Jz 


=T 
En el ejercicio 20 se le pide demostrar que (cos kx, cos kx) = 7 y (1, 1) = 27. 
Ahora se tiene 


proyw(f) = ay + a cosx +: + a, cosnx + b,senx +: +b,sennx (2) 


donde 
l 1 T 
a= S ->f f(x)dx 
kx, r 
ak = E ah E A f(x) cos kxdx (3) 


n ze. i f(x) sen kxdx 


(sen kx, sen kx) Tr] 


para k = 1. La aproximación a f dada por las ecuaciones (2) y (3) se llama aproximación 
de Fourier de n-ésimo orden a f sobre [— mT, m]. Los coeficientes ag ay»... > ap b,,...,b,, 
se llaman coeficientes de Fourier de f. 


Ejemplo 7.44 


Encuentre la aproximación de Fourier de cuarto orden a f(x) = x sobre [~ r, 71]. 


Solución Al usar las fórmulas (3), se obtiene 


y para k = 1, la integración por partes produce 


1” 1 1 tj 
| x cos kr de = L|Esen kx H cos k =0 


T 


Jean-Baptiste Joseph Fourier (1768- 
1830) fue un matemático y físico 
francés que ganó renombre por sus 
investigaciones acerca de la teoría 
del calor. En su histórica solución a 
la llamada ecuación térmica, intro- 
dujo técnicas relacionadas con lo 
que ahora se conoce como series de 
Fourier, una herramienta amplia- 
mente usada en muchas ramas de las 
matemáticas, la física y la ingeniería. 
Fourier fue un activista político du- 
rante la Revolución francesa y se 
convirtió en favorito de Napoleón, a 
quien acompañó en su campaña a 
Egipto en 1798. Más tarde, 
Napoleón nombró a Fourier pre- 
fecto de Isère, donde supervisó mu- 
chos importantes proyectos de inge- 
niería. En 1808, Fourier se convirtió 
en barón. Una placa en la Torre Eiffel 
lo honra. 


Sección 7.5 Aplicaciones 639 


1(7 1 x 1 e 
y hm] senede | y Sos kx asen] 
1 | =r cos kr — m cos(—k1r) 
ar k 


2 
E si k es par 


Z si k es impar 
2( =j jt! 
k 
Se tiene que la aproximación de Fourier de cuarto orden a f(x) = x sobre [—rr, m] es 
2(sen x — 3sen2x + 3 sen 3x — 7 sen 4x) 


La figura 7.27 muestra las primeras cuatro aproximaciones de Fourier a f(x) = x sobre 
[7,71]. 


Figura 7.27 
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Claramente puede ver que las aproximaciones de la figura 7.27 mejoran, un hecho que 
puede confirmarse al calcular el error cuadrático medio en cada caso. Conforme aumenta 
el orden de las aproximaciones de Fourier, puede demostrarse que este error tiende a cero. 
Entonces el polinomio trigonométrico se convierte en una serie infinita y se escribe 


[e] 


f(x) = ay + Y (a, cos kx + b,sen kx) 


k=1 


Ésta se llama serie de Fourier de f sobre [—1r, 71]. 


Considere el código de triple repetición 
C = (cp 01) = 01,11 


Si ocurren uno o dos errores en la transmisión de alguno de dichos vectores código, el 
vector resultante no puede ser otro vector en C. De modo que C puede detectar hasta dos 
errores. Por ejemplo, si ocurren errores en la primera y segunda entradas cuando se 
transmite cą, entonces se recibe el vector 


0 


Sin embargo, el receptor no tiene forma de corregir el error, pues c' también resultaría si 
ocurriera un solo error durante la transmisión de c,. Pero cualquier error individual 
puede corregirse, pues el vector resultante puede surgir sólo de una forma. Por ejemplo, 
si se recibe 


y se sabe que cuando mucho ocurrió un error, entonces el vector original debió ser co 
pues c” no puede surgir de c, vía un solo error. 

Ahora se generalizarán estas ideas. Como verá, la noción de distancia de Hamming 
tiene un papel crucial en la definición. 


Definición Sea C un código (binario). La distancia mínima de C es la menor dis- 
tancia de Hamming entre dos vectores distintos cualesquiera en C. Esto es, 


d(C) = mínfdy(x y) :x + y en C} 


Claramente, la distancia mínima del anterior código de triple repetición C es 3. 


Ejemplo 7.45 


Encuentre la distancia mínima del código 


C= [Co Ci, Ca, c3} 


donde Co 


II 

D n O S O 
p 
II 

= O =. O 
o 
II 

O PP O — 
pl 
| 

= =e a a 


Figura 7.29 
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Solución Es necesario calcular la distancia de Hamming entre cada par de distintos 


a í 4 
vectores. [Existen cuatro vectores, de modo que existen (2) = 6 pares.] Se encuentra 
que: 


dul Cy c1) = 


2 
d(c c,) = 4 d(c» c3) = 2 dy(c, c3) = 2 


Por tanto, d(C) = 2. ) 


Es posible representar geométricamente las nociones de distancia mínima y de co- 
rrección de error. En el caso del código de triple repetición C, se tiene un subconjunto 
(en realidad, un subespacio) de Z}. Puede representar los vectores en Z} como los vérti- 
ces de un cubo unitario, como se muestra en la figura 7.28(a). La distancia de Hamming 
entre cualesquiera dos vectores x y y es justo el número de aristas en una trayectoria más 
corta de x a y. El código C corresponde a dos de dichos vértices, c} y c}. El hecho de que 
d(C) = 3 corresponde al hecho de que c, y c, están separados tres unidades, como se 
muestra en la figura 7.28(b). Si un vector x recibido está dentro de una unidad de cual- 
quiera de dichos vectores código y se sabe que cuando mucho ocurrió un error, puede 
decodificar correctamente x como el vector código más cercano. En la figura 7.28(b), x se 
decodificaría como c, y y se decodificaría como c,. Esto concuerda con el hecho de que 
C puede corregir errores individuales mas no dobles. 


.. 


e 


(a) (b) 
Figura 7.28 


En el ejercicio 41 se le pide dibujar una imagen que ilustre la situación del ejemplo 
7.45. En general, no es posible dibujar imágenes de Z}, pero es útil una analogía eucli- 
diana. Si un código puede corregir hasta k errores, piense en los vectores código como en 
los centros de esferas de radio k. Los vectores código en ellos mismos están separados por 
al menos d unidades. Entonces, si un vector x recibido está dentro de una de dichas esfe- 
ras, se decodificará como el vector correspondiente al centro de dicha esfera. En la figura 
7.29, x se decodificará como cy. Este proceso se conoce como decodificación por el ve- 
cino más próximo. 

La figura 7.29 ilustra que si un código puede corregir k errores, entonces las “esferas” 
con centro en los vectores código no pueden tocarse o traslaparse; esto es: se debe tener 
d > 2k. Esto evidencia ser correcto, como se precisará ahora. Se dice que un código de- 
tecta k errores si, para cada vector de código c y cada vector c' que se obtiene al cambiar 
hasta k entradas de c, c' no es un vector de código. Se dice que un código corrige k erro- 
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res si, para cada vector de código c y cada vector c' que se obtiene al cambiar hasta k en- 
tradas de c, la decodificación por el vecino más próximo de c' produce c. 


Teorema 7.20 


Sea C un código (binario) con distancia mínima d. 


a. C detecta k errores si y sólo sid = k + 1. 
b. C corrige k errores si y sólo si d = 2k + 1. 


Demostración (a) Suponga que d = k + 1 y sea c un vector en C. Si hasta k errores se 
introducen en c, entonces el vector resultante c' tiene la propiedad de que d,,(c, c’) 5 k. 
Pero entonces c' no puede ser un vector de código, pues si lo fuera, se tendría 


k+1=s=d=sdy(c,c)=k 


lo que es imposible. 

Por el contrario, si C puede detectar hasta k errores, entonces la distancia mínima 
entre cualesquiera dos vectores de código debe ser mayor que k. (¿Por qué?) Se tiene que 
d=k+1. 


(b) Suponga que d = 2k + 1 y sea c un vector en C. Como en la demostración de la 
propiedad (a), sea c' un vector tal que dy(c, c') < k. Sea b otro vector en C. Entonces 
dy (c,b) = d = 2k + 1, de modo que, por la desigualdad del triángulo, 


dulce, c') + dy(e”,b) = dy(c, b) = 2k + 1 
Por tanto, 
dy(c', b) = 2k + 1 — dylc,c') >2k+1=k=k+1> dy(e”, c) 


De modo que c' está más cerca de c que de b, y la decodificación por el vecino más pró- 
ximo decodifica correctamente c’ como c. 
Por el contrario, suponga que C puede corregir hasta k errores. Se demostrará que si 
d < 2k + 1 (esto es, d = 2k), entonces se obtiene una contradicción. Para hacer esto, se 
encontrará un vector código c y un vector c’ tal que d,,(c, c') < k, pero la decodificación 
por el vecino más próximo decodifica c' como el vector de código equivocado b + c. 
Sean b y c cualesquiera vectores de código en C tales que 


du(b,c) = d = 2k 


No hay daño al suponer que dichos d errores ocurren en las primeras d entradas de b. 
(De otro modo, puede permutar las entradas de todos los vectores hasta que esto sea ver- 
dadero.) Si supone que los vectores de código en C tienen longitud n, construya un vec- 
tor c' en Z5 del modo siguiente. Haga que c' concuerde con b en las primeras k entradas, 
concuerde con c en las siguientes d — k entradas (¿por qué d = k?) y concuerde tanto con 
b como con c en las últimas n — d entradas. En otras palabras, las entradas de c' satisfa- 
cen 


bi A c i= O - 
c=34G6*b, sii=k+1...,d 
b=c sii=d+1,...,1 


Ahora dy,(c,c') = ky dy, (c',b) = d — k = k. (¿Por qué?) En consecuencia, d,,(c”, b) 
< d(c’, c), de modo que se tiene igualdad y es imposible decidir si c” debe decodificarse 
como b o c, o la desigualdad es estricta y c' se decodificará incorrectamente como b. En 
cualquier caso, se demostró que C no puede corregir k errores, lo que contradice la hi- 
pótesis. Se concluye que d = 2k + 1. — 


Algunos libros llaman a tal código 
un código (n,2 d) o, de manera 
más general, un código (n, M, d), 
donde n es la longitud de los vec- 
tores, M es el número de vectores 
de código y d es la distancia mí- 
nima. 
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En el caso de un código lineal, se tiene la siguiente notación: si un código lineal (n, k) 
tiene distancia mínima d, se le conoce como un código (n, k, d). Por ejemplo, el código 
del ejemplo 7.45 es un código (4, 2, 2). Los códigos lineales tienen la ventaja de que su 
distancia mínima puede determinarse con facilidad. En el ejercicio 42 se le pide demos- 
trar que la distancia mínima de un código lineal es la misma que el peso mínimo de un 
vector de código distinto de cero. También es posible determinar d(C) al examinar una 
matriz de control de paridad para C. 


Teorema 7.21 


Sea C un código lineal (n, k) con matriz de verificación de paridad P. Entonces la dis- 
tancia mínima de C es el entero más pequeño d para el cual P tiene d columnas lineal- 
mente dependientes. 


Demostración Suponga que d(C) = d. La matriz de control de paridad P es una matriz 
de (n — k) X n con la propiedad de que, para cualquier vector x en Z}, Px = 0 si y sólo 
si x está en C. Como se le pedirá demostrar en el ejercicio 42, C contiene un vector c de 
peso d. Entonces Pc es una combinación lineal de exactamente d columnas de P. Pero, 
puesto que Pc = 0, esto implica que algún conjunto de d columnas de P es linealmente 
dependiente. Por otra parte, suponga que algún conjunto de d — 1 columnas de P es li- 
nealmente dependiente, por decir, 


Pi FP t: +p, 20 


Sea x un vector en Z} con números 1 en las posiciones 1,,....,1¿_, y ceros en cualquier 
otra parte. Entonces x es un vector de peso d — 1 tal que Px = 0. Por tanto, x es un vec- 
tor de código de peso d — 1 < d = d(C). Esto es imposible, por el ejercicio 42, así que se 
deduce que rank(P) = d- 1. 

Por el contrario, suponga que cualesquiera d — 1 columnas de P son linealmente in- 
dependientes pero algún conjunto de d columnas de P es linealmente dependiente. 
Puesto que Px es una combinación lineal de dichas columnas de P que corresponde a las 
posiciones de los 1 en x, Px + 0 para cualquier vector x de peso d — 1 o menor. Por tanto, 
no existen vectores código distintos de cero de peso menor que d. Pero algún conjunto 
de d columnas de P es linealmente dependiente, de modo que existe un vector x de peso 
d tal que Px = 0. En consecuencia, esta x es un vector código de peso d. Por el ejercicio 
42 nuevamente, se deduce que d(C) = d. D 


Ejemplo 7.46 


Demuestre que todos los códigos de Hamming tienen distancia mínima 3. 


Solución Recuerde que el código de Hamming (n, k) tiene una matriz de control de pa- 
ridad de (n — k) X n cuyas columnas son todos los vectores distintos de cero de 
Z*, ordenados de modo que la matriz identidad ocupa las últimas n — k columnas. Por 
ejemplo, el código de Hamming (7, 4) tiene matriz de control de paridad 


1 1 O 1 100 
P=|1 0 111010 
O 1 1 1 0 0 1I 


Siempre es posible encontrar tres columnas linealmente dependientes: sólo tome las co- 
lumnas correspondientes a e}, e, y e, + e,. (En la matriz anterior, serían las columnas 5, 
6 y 1, respectivamente.) Pero cualesquiera dos columnas son linealmente independien- 
tes. Por el Teorema 7.21, esto significa que los códigos de Hamming tienen distancia mí- 
nima 3. 
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El ejemplo 7.46, combinado con el Teorema 7.20, dice que los códigos de Hamming 
son todos de corrección de error individual. El otro tipo principal de código lineal que se 
consideró es la familia de códigos de Reed-Muller. Los mismos son capaces de corregir 
muchos errores, que es una de las razones por las que se eligen para transmitir fotogra- 


fías desde el espacio. 


Ejemplo 7.47 


Demuestre que el código R,, de Reed-Muller tiene distancia mínima 2”! para n = 1. 


Solución Por el Teorema 6.35, todo vector en R,, excepto 0 y 1, tiene peso 2””*, Dado 
que 1 tiene peso 2”, esto significa que el peso mínimo de un vector de código distinto de 


cero en R, es 2””!, Por tanto, d(R,) = 2"”?, por el ejercicio 42. 


= 


El Mariner 9 usó el código R, de Reed-Muller, cuya distancia mínima es 2* = 16. Por 
el Teorema 1, este código puede corregir k errores, donde 2k + 1 <= 16. El valor más 
grande de k para el cual esta desigualdad es verdadera es k = 7. Por tanto, R, no sólo con- 
tiene exactamente el número correcto de vectores de código para transmitir 64 tonos de 
gris, sino también es capaz de corregir hasta 7 errores, lo que lo hace muy confiable. ¡Esto 
explica por qué las imágenes transmitidas por el Mariner 9 eran tan claras! 


|Hercicios 1.5 


Es Aproximación de funciones 


En los ejercicios 1-4, encuentre la mejor aproximación lineal a 
fsobre el intervalo [—1, 1]. 


1. fx) = x? 
3. f(x) = x 


2. f(x) = x? + 2x 
4. f(x) = sen(7rx/2) 


En los ejercicios 5 y 6, encuentre la mejor aproximación cua- 
drática a f sobre el intervalo [—1, 1]. 
5. f(x) = |x| 6. f(x) = cos(1rx/2) 
7. Aplique el proceso de Gram-Schmidt a la base (1, x} 
para construir una base ortogonal para Y, [0, 1]. 


8. Aplique el proceso de Gram-Schmidt a la base (1, x, x°} 
para construir una base ortogonal para P, [0, 1]. 


En los ejercicios 9-12, encuentre la mejor aproximación lineal 
a f sobre el intervalo [0, 1]. 


9. fla) = x? 
11. f(x) = e* 


10. f(x) = Vx 
12. f(x) = sen(mTx/2) 


En los ejercicios 13-16, encuentre la mejor aproximación cua- 
drática a f sobre el intervalo [0, 1]. 


13. f(x) = x 14. f(x) = Vx 

15. f(x) = e* 16. f(x) = sen(7rx/2) 

17. Demuestre que 1 es ortogonal a cos kx y sen kx en 
El- r, T] para k= 1. 


18. Demuestre que cos jx es ortogonal a cos kx en €|- r, 
m] paraj *k,jk= 1. 


19. Demuestre que sen jx es ortogonal a sen kx en 6 [—7, 
T] paraj Ak jk=l1. 


20. Demuestre que || 1|? = 27 y ||cos kx]? = m en €[—7r, 
T]. 


En los ejercicios 21 y 22, encuentre la aproximación de Fourier 
de tercer orden a f sobre | —ar, 71]. 


21. f(x) = |x| 22. f(x) =x 


En los ejercicios 23-26 encuentre los coeficientes de Fourier ap, 
a, y b, de f sobre |- m, 7]. 
0 si-rmrsx<0 
23. f(x) = 
$) $ si0=x<x"T 
== EY 
t si0=x<T 


26. f(x) = lx] 


24. f(x) = l 


25. f(x) =m = 


Recuerde que una función f es una función par si 
Hex) = f(x) para toda x; f se llama función impar si 
f(—x) = f(x) para toda x. 


T 
27. (a) Demuestre que | f(x) dx = 0 si fes una función 
z =T 
impar. 
(b) Demuestre que los coeficientes de Fourier a, son 
todos cero si fes impar. 


=T: 


28. (a) Demuestre que | f(x) dx = 2 | f(x)dx si fes una 
función par. ° 


(b) Demuestre que los coeficientes de Fourier b, son 
todos cero si f es par. 


Encuentre la distancia mínima de los códigos en los ejercicios 
29-34. 


29.C= 


—. o m. 


30. C = 


1 0 0 
31. El código de paridad par E, 


32. El código de repetición de n veces, Rep, 


33. El código con matriz de control de paridad P = [I A], 
donde 


110.110 | 

1 O 1 1 1 1 0 
A= 

O 1 1 1000 

000111 dl 


34. El código con matriz de control de paridad 


1 1 0 0 
P=|1 1 1 1 
1 0 0 1 


Repaso del capítulo 645 


En los ejercicios 35 y 36, calcule la distancia mínima del có- 
digo C y decodifique los vectores u, v y w usando la decodifica- 
ción por el vecino más próximo. 


1|[|1[|[o|[o0 1 0 0 
0||1|[0|[1 1 1 0 
35. C=3|0|/0||1/||1|pu=|0|v=|0|w=|0 
1|fo|[0||1 0 0 0 
o||1]|1]|0 0 0 1 
36. C tiene matriz generadora 
1 0 0 1 1 0 
0.1.0 0 1 0 
0 0 1 0 1 0 
G=|1 1 0/u=|0|v=|0|w=]|0 
1.0 1 1 0 1 
0 1 1 1 0 1 
1 1 1 0 0 1 


En los ejercicios 37-40, construya un código lineal (n, k, d) o 

demuestre que no existe tal código. 

37.n=8k=1d=8 38.n=8,k =2d=8 

39.1n=8k=5d=5 40.n=8k=4d=4 

41. Dibuje una imagen (similar a la figura 7.28) para ilus- 
trar el ejemplo 7.45. 

42. Sea C un código lineal. Demuestre que la distancia mí- 
nima de C es igual al peso mínimo de un vector de có- 
digo distinto de cero. 

43. Demuestre que d — 1 < n — k para cualquier código li- 
neal (n, k, d). 

44. Sea C un código lineal (n, k, d) con matriz de control de 
paridad P. Pruebe que d = n — k + 1 si y sólo si todas 
las n — k columnas de P son linealmente independien- 
tes. 


Definiciones y conceptos clave 


base ortogonal, 560 

base ortonormal, 560 

conjunto ortogonal de vectores, 560 

conjunto ortonormal de vectores, 
560 

descomposición de valor singular 
(DVS), 616 

desigualdad de Cauchy-Schwarz, 562 

desigualdad del triángulo, 563 

distancia, 558 


distancia de Hamming, 577 

esfera unitaria, 558 

espacio con producto interno, 554 
espacio lineal normado, 575 

error de mínimos cuadrados, 595 
matriz bien condicionada, 584 
matriz mal condicionada, 584 
norma, 575 

norma de Frobenius, 579 

norma de Hamming, 577 


norma euclidiana (2-norma), 576 

norma matricial, 579 

norma máx (oo-norma, norma 
uniforme), 576 

norma suma (1-norma), 575 

número de condición de una matriz, 
584 

operador norma, 582 

producto interno, 554 

proyección ortogonal, 561, 606 


646 Capítulo 7 Distancia y aproximación 


pseudoinversa de una matriz, 608, 


teorema de mejor aproximación, 593 


valores singulares, 613 


625 teorema de mínimos cuadrados, 598 vector unitario, 558 
solución por mínimos cuadrados, 597, teorema fundamental de las matrices vectores singulares, 616 
627 Invertibles, 628 


1. Marque cada uno de los siguientes enunciados como 
verdadero o falso: 


(a) Siu = ll y v= f” | entonces (u, v) = uv 
2 


2 


+ muv, define un producto interno sobre R°. 


(b) Siu = la y v= f” | entonces (u, v) = 
u v 
4u,v, — 2u,v, — 2u,v, + 4u,v, define un producto in- 
terno sobre R°. 

(c) (A, B) = tr(A) + tr(B) define un producto interno 
sobre M,,. 

(d) Si u y v son vectores en un espacio con producto in- 
terno con ||ul| = 4, lvl] = V5 y (u, v) = 2, en- 
tonces ||u + vl| = 5. 

(e) La norma suma, norma máx y la norma euclidiana 
sobre R” son todas iguales a la función valor abso- 
luto cuando n = 1. 

(£) Si una matriz A está bien condicionada, entonces 
cond(A) es pequeña. 

(g) Si cond(A) es pequeña, entonces la matriz A está 
bien condicionada. 

(h) Todo sistema lineal tiene una solución única por 
mínimos cuadrados. 

(i) Si A es una matriz con columnas ortonormales, en- 
tonces la matriz estándar de una proyección ortogo- 
nal sobre el espacio columna de A es P = AA". 

(j) Si A es una matriz simétrica, entonces los valores 
singulares de A son iguales que los eigenvalores 
de A. 


En las preguntas 2-4, determine si la definición proporciona 
un producto interno. 


2. (P(x), q(x)) = pl0)q(1) + p(1)a(0) para p(x), q(x) en P, 
3. (A, B) = tr(A"B) para A, Ben M,, 


4. (f, g) = ( máx f(x) )( máx g(x)) para f, gen €[0, 1] 


0O=x=1 O=x=1 


En las preguntas 5 y 6, calcule la cantidad indicada usando el 
producto interno especificado. 
5. |1 + x + a? l] si(a, + ax + ax’, by + bix + bx?) = 
ayb, + ayb, + a,b, 


6. d(x, xX) si (p(x), q(x)) = S¿plc)a(x) dx 


En las preguntas 7 y 8, construya un conjunto ortogonal de 
vectores al aplicar el proceso de Gram-Schmidt al conjunto 
dado de vectores, usando el producto interno especificado. 


Ti fi, I} silu, v} = u” Av, donde A = $ 4] 


8. [1,x,x7 si (p(x), q(x)) = ¡ESTO dx 


En las preguntas 9 y 10, determine si la definición proporciona 
una norma. 


9. ||v]| = vv para v en R” 


10. Ip(x)ll = [p(0)| + lp(1) — p(0)| para p(x) en P, 


1 0.1 0.11 
0.111 
0.1111 


11. Demuestre que la matriz A = | 0.1 0.11 
0.11 0.111 
está mal condicionada. 


12. Pruebe que si Q es una matriz ortogonal de n X n, en- 
tonces su norma de Frobenius es || Q|| r= Vn. 


13. Encuentre la recta de mejor ajuste a través de los puntos 
(1, 2), (2, 3), (3, 5) y (4, 7). 
14. Encuentre la solución por mínimos cuadrados de 


1 2 

1 ojļfx%x] | o0 

2 =1 Al | - 

0 5 3 

1 
15. Encuentre la proyección ortogonal dex = | 2 | sobre el 
1 1 ý 
espacio columna de A = |0 1]. 

1 0 


16. Si u y v son vectores ortonormales, demuestre que 
P = uu” + vv” es la matriz estándar de una proyección 
ortogonal sobre gen(u, v). [Sugerencia: demuestre que 
P = A(A"A) 14” para alguna matriz A.] 


Repaso del capítulo 641 


En las preguntas 17 y 18, encuentre (a) los valores singulares, 19. Si P y Q son matrices ortogonales para las cuales está 
(b) una descomposición de valor singular y (c) la pseudoin- definida PAQ, pruebe que PAQ tiene los mismos valores 
versa de la matriz A. singulares que A. 
1 1 20. Si A es una matriz cuadrada para la cual A? = O, pruebe 
1 1 -1 has 
17.A=|0 0 18, 4= |) j l que (A`) = O. 


Por favor, señor, quiero un poco más. 
—-Oliver 
Charles Dickens, Oliver Twist 


Quienquiera que entienda la notación 
algebraica lee de un vistazo en una 
ecuación resultados que se alcanzan 
aritméticamente sólo con gran trabajo 
y dolor. 
— Augustin Cournot 
Researches into the Mathematical 
Principles of the Theory of Wealth 
Traducido por Nathaniel T. Bacon 
Macmillan, 1897, p. 4 
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Apéndice A* 


Notación matemática 
y métodos de demostración 


En este libro se hizo un esfuerzo para usar “idioma matemático” tanto como fuera posi- 
ble y mantener la notación matemática al mínimo. Sin embargo, la notación matemática 
es una taquigrafía conveniente que puede simplificar enormemente la cantidad de escri- 
tura que debe realizarse. Más aún, se usa comúnmente en toda rama de las matemáticas, 
de modo que la habilidad de leer y escribir notación matemática es un ingrediente esen- 
cial de la comprensión matemática. Finalmente, existen algunos teoremas cuyas demos- 
traciones se vuelven “obvias” si se usa la notación correcta. 

Demostrar teoremas en matemáticas es tanto un arte como una ciencia. Para el princi- 
piante, con frecuencia es difícil saber cuál método usar para demostrar un teorema; existen 
muchos métodos, y cualquiera puede evidenciar ser el mejor. Para volverse hábil en las de- 
mostraciones, es importante estudiar tantos ejemplos como sea posible y tener mucha 
práctica. 

Este apéndice resume la notación matemática básica que se aplica a los conjuntos. 
También se estudia la notación suma, una útil taquigrafía para lidiar con las sumas. Fi- 
nalmente, se ilustran algunos métodos de demostración con ejemplos genéricos. 


Un conjunto es una colección de objetos, llamados elementos (o miembros) del con- 
junto. Los ejemplos de conjuntos incluyen el conjunto de todas las palabras en este texto, el 
conjunto de todos los libros en la biblioteca de su escuela, el conjunto de los enteros po- 
sitivos y el conjunto de todos los vectores en el plano cuya ecuación es 2x + 3y — z = 0. 

Con frecuencia es posible mencionar los elementos de un conjunto, en cuyo caso es 
convencional encerrar la lista dentro de llaves. Por ejemplo, se tiene 


T 2T T 4T 5T 
1,2,35, 46b% 42,4,6,...,100y, > A OS 
(1,23), ate d y LA 
Note que los puntos suspensivos (. . .) denotan elementos omitidos cuando se presenta 
un patrón. (¿Cuál es el patrón en los últimos dos ejemplos?) Los conjuntos infinitos con 
frecuencia se expresan usando puntos suspensivos. Por ejemplo, el conjunto de los ente- 
ros positivos por lo general se denota mediante N o Z*, de modo que 


N = Z* =(1,2,3,...) 
El conjunto de todos los enteros se denota mediante Z, de modo que 
Z=4...,-2,-1,0,1,2,...) 


Dos conjuntos se consideran iguales si contienen exactamente los mismos elemen- 
tos. El orden en el que se mencionan los elementos no importa, y las repeticiones no se 
cuentan. Por tanto, 


*En el sitio Web para el estudiante puede encontrar ejercicios y respuestas seleccionadas con número impar 
para este apéndice. 
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(1,2,3) = (2,1,3) =(1,3,2,1) 
El símbolo € significa “es elemento de” o “está en”, y el símbolo ¢ denota la nega- 
ción; esto es, “no es elemento de” o “no está en”. Por ejemplo, 


5EZ* pero 0 ¢Z* 


Con frecuencia es más conveniente describir un conjunto en términos de una regla 
que satisfagan todos sus elementos. En tales casos es apropiada la notación de construc- 
ción de conjuntos. El formato es 


{x : x satisface a P} 


donde P representa una propiedad o una colección de propiedades que debe satisfacer el 
elemento x. Los dos puntos se pronuncian “tal que”. Por ejemplo, 


{n:n E Z,n > 0) 


se lee como “el conjunto de todas las n tales que n es un entero y n es mayor que cero”. 
Esta sólo es otra forma de describir los enteros positivos Z*. (También podría escribirse 
Z*=1(nE€Z:n>0),) 

El conjunto vacío es el conjunto sin elementos. Se denota Ø o [ }. 


Ejemplo A.1 


John Venn (1834-1923) fue un 
matemático inglés que estudió en la 
Universidad de Cambridge y más 
tarde dio clases ahí. Trabajó 
principalmente en lógica 
matemática y es mejor conocido por 
inventar los diagramas de Venn. 


Describa con palabras los siguientes conjuntos: 


(a) A={n:n=2k,kE€ Z} (b) B={m/n:mnEZ,n + 0) 
(c) C= {x E R:4x°-— 4x -— 3 = 0} (d) D= {xE Z: 4x — 4x — 3 = 0} 


Solución (a) A es el conjunto de números n que son múltiplos enteros de 2. Por tanto, 
A es el conjunto de todos los enteros pares. 


(b) B es el conjunto de todas las expresiones de la forma m/n, donde m y n son enteros 
y n es distinto de cero. Este es el conjunto de números racionales, que usualmente se de- 
nota Q. (Note que esta forma de describir Q produce muchas repeticiones; sin embargo, 
la convención, que se puntualizó anteriormente, es que sólo se incluya una vez cada ele- 
mento. Por tanto, esta expresión describe precisamente el conjunto de todos los números 
racionales.) 


(c) C es el conjunto de todas las soluciones reales de la ecuación 4x? — 4x — 3 = 0. Al 

factorizar o usar la fórmula cuadrática, se encuentra que las raíces de esta ecuación son 
i E . 

—=3 y > (Verifique esto.) Por tanto, 


(d) A partir de la solución a (c) se ve que no existen soluciones para 4x? — 4x — 3 = 0 en 
R que sean enteras. Por tanto, D es el conjunto vacío, que puede expresarse al escribir 


D=4. < 


Si todo elemento de un conjunto A también es un elemento de un conjunto B, en- 
tonces A es un subconjunto de B, lo que se denota A C B. Esta situación puede repre- 
sentarse esquemáticamente con el uso de un diagrama de Venn, como se muestra en la 
figura A.1. (El rectángulo representa el conjunto universal, un conjunto suficientemente 
grande para contener todos los otros conjuntos en cuestión, en este caso, A y B.) 
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Figura A.1 
ACB 


Ejemplo A.2 


(a) {1,2,3} C {1, 2, 3, 4, 5) 
(b) ZFCZCR 
(c) Sea A el conjunto de todos los enteros positivos cuyos dos últimos dígitos son 24 y 


sea B el conjunto de todos los enteros positivos que son divisibles entre 4. Entonces, si n 
está en A, es de la forma 


n = 100k + 24 
para algún entero k. (Por ejemplo, 36,524 = 100 - 365 + 24.) Pero entonces 
n = 100k + 24 = 4(25k + 6) 


de modo que 1/4 = 25k + 6, que es un entero. En consecuencia, n es divisible entre 4, 
como también lo es B. Por tanto, A C B. 


Es posible demostrar que dos conjuntos A y B son iguales al probar que cada uno es 
un subconjunto del otro. Esta estrategia es particularmente útil si los conjuntos se defi- 
nen de manera abstracta o si no es fácil mencionar y comparar sus elementos. 


Sea A el conjunto de todos los enteros positivos cuyos dos últimos dígitos forman un nú- 
mero que es divisible entre 4. En el caso de un número de un dígito, se toma su dígito de 
decenas como 0. Sea B el conjunto de todos los enteros positivos que son divisibles entre 4. 
Demuestre que A = B. 


Solución Como en el ejemplo A.2(c), es fácil ver que A C B. Si n está en A, entonces es 
posible dividir el número m formado por sus dos últimos dígitos al escribir 


= 100k + m 
para algún entero k. Pero, puesto que m es divisible entre 4, se tiene m = 4r para algún 
entero 7. 
n = 100k + m = 100k + 4r = 4(25k + r) 
de modo que n también es divisible entre 4. En consecuencia, A C B. 

Para demostrar que B C A, sea n que está en B. Esto es, n es divisible entre 4. Suponga 
que n = 4s, donde s es un entero. Si m es el número formado por los dos últimos dígitos 
de n, entonces, como antes, n = 100k + m para algún entero k. Pero ahora 

m = n — 100k = 4s — 100k = 4(s — 25k) 
lo que implica que m es divisible entre 4, pues s — 25k es un entero. Por tanto, n está en 
A, y se demostró que B C A. 
Puesto que A C B y B C A, se debe tener A = B. | 
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La intersección de los conjuntos A y B se denota A N B y consiste de los elementos 
que A y B tienen en común. Esto es: 


ABRAS E B} 


La figura A.2 muestra un diagrama de Venn para este caso. La unión de A y B se denota 
AU B y consiste de los elementos que están en A o en B (o en ambos). Esto es, 


AUB So E B| 


Vea la figura A.3. 
Figura A.2 Figura A.3 
ANB AUB 


Ejemplo A.4 


Figura A.4 


Conjuntos disjuntos 


2 es la letra griega mayúscula 
sigma, que corresponde a S (por 
“suma”). La notación suma la 
introdujo Fourier en 1820 y 

la comunidad matemática la 
adoptó rápidamente. 


> 


Sea A = {n:n E Z*,1 S n S4} ysea B = {n E Z* :n=<10 y n es impar). Encuentre 
ANByAUB. 


Solución Se ve que 
A = {17 2,3 4#} =(1,49,16) y B= {1,3,5,7,9} 


Por tanto, A N B = (1,9 y AU B = {1, 3, 4, 5,7,9, 16}. 


-l 


SIAN B = Ø, entonces A y B se llaman conjuntos disjuntos. (Vea la figura A.4.) Por 
ejemplo, el conjunto de enteros pares y el conjunto de enteros impares son disjuntos. 


La notación suma es una taquigrafía conveniente para escribir una suma como 
1+2+3+--+ 100 


donde se quiere eliminar casi todos los elementos. Como en la notación de conjuntos, los 
puntos suspensivos (. . .) significan que se estableció un patrón y que simplemente se 
quitaron algunos términos intermedios. En el ejemplo anterior se espera que los lectores 
reconozcan que se suman todos los enteros positivos de 1 a 100. Sin embargo, los puntos 
suspensivos pueden ser ambiguos. Por ejemplo, ¿cómo sería la suma 


1+2 +: +64 
¿Es la suma de todos los enteros positivos desde 1 hasta 64 o sólo de las potencias de dos, 


1 +2 +4+8 +16 + 32 + 64? Con frecuencia es más claro (y más corto) usar nota- 
ción suma (o notación sigma). 
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Es posible abreviar una suma de la forma 
a+ a+: +a, (1) 


como > Az (2) 
k=1 


que dice que hay que sumar los términos a, sobre todos los enteros k que van desde 1 
hasta n. Una versión alternativa de esta expresión es 


È a 


l1=k=n 


El subíndice k se llama índice de suma. Es una “variable falsa” en el sentido de que no 
aparece en la suma real de la expresión (1). Por tanto, puede usar cualquier letra que 
quiera como el índice de suma (en tanto no aparezca ya en alguna otra parte de las ex- 
presiones que se están sumando). Por ende, la expresión (2) también puede escribirse 
como 


El índice de suma no necesita comenzar en 1. La suma a, + a, ++: + ayy se convierte en 
99 
Da 
k=3 
aunque puede disponer que el índice comience en 1 al reescribir la expresión como 
97 
D2 Ak+z 
k=1 


La clave para usar la notación suma de manera efectiva es poder reconocer los patrones. 


> 


Escriba las siguientes sumas usando la notación suma. 


(a) 142 +4+-=-+64 (b) 1+3+5+-"+99 (c) 3+8+154+-:+99 


Solución (a) Esta expresión se reconoce como una suma de potencias de 2: 


1+2+4+ ds A 
6 


Por tanto, el índice de suma aparece como el exponente y se tiene y an, 
k=0 


(b) Esta expresión es la suma de todos los enteros impares desde 1 hasta 99. Todo entero 
impar es de la forma 2k + 1, de modo que la suma es 


1+3+5+ +99 
=(2-0 +1) +(2-1 +1) +(Q-2+ 1) ++:+(2-49+1) 


S (2k+ 1) 


(c) Aquí el patrón es menos claro, pero un poco de reflexión revela que cada término es 
1 menos que un cuadrado perfecto: 


+34 15 +40 
= (2 — 1) + (3? — 1) +14 — 1) +--+ (10 — 1) 


= XE- A 
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Ejemplo A.6 Reescriba cada una de las sumas en el ejemplo A.5 de modo que el índice suma comience 
en l. 


Solución (a) Si usa el cambio de variable i = k + 1, entonces, conforme k avanza de 0 
a 6, i va de 1 a 7. Puesto que k = 1 — 1, se obtiene 


6 ye 
$2- $7 
k=0 i=1 


(b) Al usar la misma sustitución que en el inciso (a), se obtiene 
49 50 50 
a = Y (A(i-1) + = 201) 


i=1 


»—> (c) La sustitución i = k — 2 funcionará (inténtelo), pero es más fácil sólo agregar un tér- 
mino correspondiente a k = 1, pues 1?— 1 = 0. Por tanto, 


Lw- 1) = >e- 


et 


Cuando hay más de un índice de suma surgen múltiples sumas, como los hay en una 
matriz. La notación 


Y a; (3) 


significa sumar los términos a; conforme 1 y j cada uno varían independientemente 
desde 1 hasta n. La suma en la expresión (3) es equivalente a 


donde la suma es primero sobre j y luego sobre i (siempre se trabaja de dentro hacia 
afuera) o 


donde se invierte el orden de la suma. 


Ejemplo A.7 o Sj ; 
jempo Escriba > i usando ambos órdenes posibles de suma. 
ij=1 


E) n 


NI =s S++”) 


i=1 j=1 ¡=1 


A A E 


=(1+1+1)+(2+4+8)+(3+9+27) = 56 
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How to Solve It es el título de un 
libro del matemático George Pólya 
(1887-1985). Desde su publicación 
en 1945, How to Solve It ha 
vendido más de un millón de 
copias y se ha traducido a 17 
idiomas. Pólya nació en Hungría, 
pero, debido a la situación política 
en Europa, se mudó a Estados 
Unidos en 1940. Posteriormente 
impartió cátedra en las 
Universidades Brown y Stanford, 
donde realizó investigación 
matemática y desarrolló una 
reputación bien merecida como 
destacado profesor. El Premio 
Pólya lo otorga anualmente la 
Society for Industrial and Applied 
Mathematics para grandes 
aportaciones en las áreas de las 
matemáticas cercanas a aquellas en 
las que trabajó Pólya. La 
Mathematical Association of 
America otorga anualmente la 
Cátedra Pólya a los matemáticos 
que demuestran la exposición de 
alta calidad por la cual se conoció 
a Pólya. 
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3 3 n 
NY i= Y (1 +2 +3) 
j=1 i=1 j=1 


A E E A 


=(14+2+3)+(1+4+9) + (1+8+27) = 56 


-l 


Comentario Desde luego, el valor de la suma en el ejemplo A. 7 es el mismo sin im- 
portar cuál orden de suma se elija, porque la suma es finita. También es posible conside- 
rar sumas infinitas (conocidas en cálculo como series infinitas), pero tales sumas no siem- 
pre tienen un valor y debe tener mucho cuidado cuando se reordenan o manipulan sus 
términos. Por ejemplo, suponga que se tiene 


s= X% 
k=0 
Entonces S=1+2+4+8+:-""" 
=1+21+2+4+-+>) 
=1+258 
de donde se sigue que S = —1. Claramente esto no tiene sentido, ¡pues S es una suma de 


términos no negativos! (¿Dónde está el error?) 


La noción de demostración está en el corazón mismo de la matemática. Una cosa es 
saber qué es verdadero; otra muy distinta es saber por qué es verdadero y poder demos- 
trar su veracidad mediante una secuencia de enunciados lógicamente conectados. La in- 
tención aquí no es tratar de enseñar cómo hacer demostraciones; usted se volverá cada 
vez mejor para hacer demostraciones al estudiar los ejemplos y practicando, algo que 
debe hacer con frecuencia mientras trabaja a lo largo de este libro. La intención de esta 
breve sección es simplemente ofrecer algunos ejemplos elementales de ciertos tipos de 
demostraciones. Las demostraciones de los teoremas en el texto proporcionarán más 
ilustraciones de “cómo resolverlo”. 

Hablando en general, las demostraciones matemáticas caen en dos categorías: de- 
mostraciones directas y demostraciones indirectas. Muchos teoremas tienen la estruc- 
tura “si P, entonces Q” donde P (la hipótesis o premisa) y Q (la conclusión) son enuncia- 
dos que son o verdaderos o falsos. Tal implicación se denota P=> Q. Una demostración 
directa procede al establecer una cadena de implicaciones 


P=>P,=>P,=>""=>P,=>0 


lo que conduce de Pa Q. 


> 
Demuestre que cualesquiera dos cuadrados perfectos consecutivos difieren por un nú- 
mero impar. Esta instrucción puede replantearse como: “demuestre que si a y b son cua- 
drados perfectos consecutivos, entonces a — b es impar”. Por tanto, tiene la forma P = Q, 
con P como “a y b son cuadrados perfectos consecutivos” y Q como “a — b es impar”. 
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Solución Suponga que a y b son cuadrados perfectos consecutivos, con a > b. Enton- 
ces 


a=(n+1)? y b=r 
para algún entero n. Pero ahora 
a=b=(n+1P=yY 
=P +2n+ 1-84 
2n + 1 


de modo que a — b es impar. 


st 


Existen dos tipos de demostraciones indirectas que pueden usarse para establecer un 
enunciado condicional de la forma P= Q. Una demostración por contradicción supone 
que la hipótesis P es verdadera, como en una demostración directa, pero luego supone que 
la conclusión Q es falsa. Entonces la estrategia es demostrar que esto no es posible (es 
decir: descartar la posibilidad de que la conclusión sea falsa) al encontrar una contradic- 
ción a la veracidad de P. Entonces se concluye que Q debe ser verdadera. 


C 


> 


Sea n un entero positivo. Demuestre que si n? es par, también lo es n. (Tome algunos mi- 
nutos para tratar de encontrar una demostración directa de esta afirmación; le ayudará 
a apreciar la demostración indirecta que sigue.) 


Solución Suponga que n es un entero positivo tal que n? es par. Ahora suponga que n 
no es par. Entonces n es impar, de modo que 


n=2k +1 
para algún entero k. Pero si es así, se tiene 
n = (2k + 1)? = 4 + 4k + 1 


de modo que n? es impar, pues es 1 más que el número par 4k? + 4k. Esto contradice la 
hipótesis de que n? es par. Se concluye que la suposición de que n no era par debe ser 


falsa; en otras palabras, n debe ser par. | 


Estrechamente relacionada con el método de demostración por contradicción está la 
demostración por contrapositivo. El negativo de un enunciado P es el enunciado “no es 
el caso que P”, que se abrevia simbólicamente como =P y se pronuncia “no P”. Por ejem- 
plo, si P es “n es par”, entonces =P es “no es el caso que n sea par”; en otras palabras “n 
es impar”, 

El contrapositivo del enunciado P= Q es el enunciado ~Q = =P. Un enunciado con- 
dicional P= Q y su contrapositivo "Q = =P son lógicamente equivalentes en el sen- 
tido de que son o ambos verdaderos o ambos son falsos. (Por ejemplo, si P= Q es un 
teorema, entonces también lo es AQ = AP. Para ver esto, note que si la hipótesis =Q es 
verdadera, entonces Q es falsa. La conclusión =P no puede ser falsa porque, si lo fuera, 
entonces P sería verdadera y el teorema conocido P=> Q implicaría la veracidad de Q, lo 
que produciría una contradicción. Se concluye que =P es verdadero y se demostró Q=>> 
=P.) He aquí una demostración contrapositiva de la afirmación del ejemplo A.9. 
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Ejemplo A.10 


Sea n un entero positivo. Demuestre que si n? es par, también lo es n. 
Solución El contrapositivo del enunciado dado es 
“Si n no es par, entonces n? no es par” o “si n es impar, también lo es n?” 


Para demostrar este contrapositivo, suponga que n es impar. Entonces n = 2k + 1 para 
algún entero k. Como antes, esto significa que n? = (2k + 1)? = 4k? + 4k + 1 es impar, 
lo que completa la demostración del contrapositivo. Puesto que el contrapositivo es ver- 
dadero, también lo es el enunciado original. 


Aunque no se requiere un nuevo método de demostración para manejarlo, se consi- 
derará brevemente cómo demostrar un teorema “si y sólo si”. Un enunciado de la forma 
“P si y sólo si Q” señala una doble implicación, que se denota P <> Q. Para demostrar tal 
enunciado, debe demostrar P = Q y Q = P. Para hacerlo, puede usar las técnicas des- 
critas anteriormente donde sea adecuado. Es importante notar que la parte “si” de 
P <& Q es “P es Q”, que es Q = P; la parte “sólo si” de P<> Q es “P sólo si Q”, lo que sig- 
nifica P=> Q. La implicación P => Q en ocasiones se lee como “P es suficiente para Q” o 
“Q es necesaria para P”; Q > P se lee “Q es suficiente para P” o “P es necesaria para Q”. 
En conjunto, son P<> Q, o “P es necesaria y suficiente para Q” y viceversa. 


Ejemplo A.11 


z- 
Un peón se coloca en un tablero de ajedrez y se le permite moverse un cuadrado a la vez, 
ya sea horizontal o verticalmente. El recorrido de un peón en un tablero de ajedrez es la 
trayectoria que sigue un peón, al moverse como se describe, que visita un cuadrado exac- 
tamente una vez, y comienza y termina en el mismo cuadrado. Demuestre que existe un 
recorrido de peón de un tablero de ajedrez de n X n si y sólo si n es par. 


Solución [<= ] (“si”) Suponga que n es par. Es fácil ver que la estrategia que se ilustra 
en la figura A.5 para un tablero de 6 X 6 siempre producirá un recorrido de peón. 

[= ] (“sólo si”) Suponga que existe un recorrido de peón en un tablero de n X n. Se 
dará una demostración por contradicción de que n debe ser par. Para este fin, suponga 
que n es impar. En cada movimiento, el peón se mueve a un cuadrado de diferente color. 
El número total de movimientos en su recorrido es n°, que también es un número impar, 
de acuerdo con la demostración del ejemplo A.10. Por tanto, el peón debe terminar en 
un cuadrado del color opuesto al del cuadrado desde el cual comenzó. (¿Por qué?) Esto 
es imposible, pues el peón termina donde comenzó, así que hay una contradicción. Se 
concluye que n no puede ser impar; por tanto, n es par y la demostración está completa. 


= 


Algunos teoremas afirman que varios enunciados son equivalentes. Esto significa que 
cada uno es verdadero si y sólo si todos los demás son verdaderos. Demostrar que n 


z 
; , A n n! n=n i ] 
enunciados son equivalentes requiere la = 2)! EE demostraciones “si y 
== 2)! 


sólo si”. Sin embargo, en la práctica, con frecuencia es más fácil establecer un “anillo” de 
n implicaciones que vincular todos los enunciados. La demostración del teorema funda- 
mental de las matrices invertibles brinda un excelente ejemplo de este enfoque. 


Las pulgas grandes tienen pulgas 
pequeñas en su espaldas que las 
muerden y las pulgas pequeñas tienen 
pulgas más pequeñas, y así ad 
infinitum 
—Augustus De Morgan 
A Budget of Paradoxes 
Longman, Green, and Company, 
1872, p. 377 


»—> 


Apéndice B* 


Inducción matemática 


La habilidad para reconocer patrones es una de las claves para triunfar en la resolución 
de problemas matemáticos. Considere el siguiente patrón: 


1=1 
1+3=4 
1+43+5=9 


1+3+5+7=16 
1+3S+53+7+9=2)3 


Las sumas son todas cuadrados perfectos: 1°, 2?, 3?, 4°, 5°. Parece razonable conjeturar 
que este patrón seguirá sosteniéndose; esto es, la suma de números impares consecuti- 
vos, a partir de 1, siempre será un cuadrado perfecto. Intente algo más práctico. Si la 
suma es n’, entonces el último número impar en la suma es 2n — 1. (Compruebe esto en 
los cinco casos anteriores.) En símbolos, la conjetura se convierte en 


143+5 + AS para toda n=1 (1) 


Note que la fórmula (1) en realidad es una colección infinita de enunciados, uno 
para cada valor de n = 1. Aunque la conjetura parece razonable, no es posible suponer 
que el patrón continúa, es necesario demostrarlo. Es aquí donde interviene la inducción 
matemática. 


Primer principio de inducción matemática 


Sea S(n) un enunciado acerca del entero positivo n. Si 


1. S(1) es verdadero y 
2. para toda k = 1, la verdad de S(k) implica la verdad de S(k + 1) 


entonces S(n) es verdadero para toda n = 1. 


Verificar que S(1) es verdadero se llama paso base. La suposición de que S(k) es ver- 
dadero para alguna k = 1 se le llama hipótesis de inducción. Al uso de la hipótesis de in- 
ducción para probar que S(k + 1) es entonces verdadera se le llama paso de inducción. 
A la inducción matemática se le refiere como el principio dominó porque es análoga a de- 
mostrar que una línea de fichas de dominó caerá si (1) la primera ficha puede derribarse 
(el paso base) y (2) derribar cualquier ficha (la hipótesis de inducción) derribará la si- 
guiente ficha (el paso de inducción). Vea la figura B.1. 

Ahora se usa el principio de inducción matemática para demostrar la fórmula (1). 


*En el sitio Web para el estudiante puede encontrar ejercicios y respuestas seleccionadas con número impar 
para este apéndice. 
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entonces puede hacerse caer a todas las fichas al empujar la primera. 


Figura B.1 


Ejemplo B.1 


Use inducción matemática para demostrar que 
1+43+5+:-"+(Qn-1)= nm? 
para toda n = 1. 


Solución Para n = 1, la suma en el lado izquierdo es 1, mientras que el lado derecho es 
1°. Puesto que 1 = 1°, esto completa el paso base. 

Ahora suponga que la fórmula es verdadera para algún entero k = 1. Esto es, su- 
ponga que 


1+3+5+:"+(2k-= 1) = k? 


(Esta es la hipótesis de inducción.) El paso de inducción consiste en demostrar que la 
fórmula es verdadera cuando n = k + 1. Se ve que, cuando n = k + 1, el lado izquierdo 
de la fórmula (1) es 


14+43+5++(Ak+1)-1)=1+3+5+-+(2k+1) 
1+3+5+--+(Qk-1)+Qk+1) 
— _- amam 
k? +2k+14 
(k+ 1) por la hipótesis 
de inducción 


que es el lado derecho de la fórmula (1) cuando n = k + 1. 
Esto completa el paso de inducción, y se concluye que la fórmula (1) es verdadera 
para toda n = 1, por el principio de inducción matemática. 
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El siguiente ejemplo brinda una demostración de una fórmula útil para la suma de 
los primeros n enteros positivos. La fórmula aparece varias veces en el texto; por ejem- 
plo, vea la solución al ejercicio 51 de la sección 2.4. 


Ejemplo B.2 


Demuestre que 
n(n + 1) 
1+42++n= 


para toda n = 1. 


Solución La fórmula es verdadera para n = 1, pues 


11 +1) 
2 
Suponga que la fórmula es verdadera para n = k; esto es, 
k(k + 1) 
O 


Es necesario demostrar que la fórmula es verdadera cuando n = k + 1; esto es, debe de- 
mostrar que 


(k + 1)[(k + 1) +1] 


1+2+-+(k+1) = E 


Pero se ve que 


1+2+ 00 +(k+1)=(1+2+  +k)+(k+1) 
k(k + 1) para la hipótesis de 


E + (k +1) inducción 


k(k + 1) + 2(k + 1) 
2 
o k? +3k+2 
2 
(k + 1)(k + 2) 
2 
(k + 1)[(k + 1) + 1] 
2 


que es lo que se necesita demostrar. 
Esto completa el paso de inducción y se concluye que la fórmula es verdadera para 
toda n = 1, por el principio de inducción matemática. 


En un modo similar, puede demostrar que la suma de los cuadrados de los primeros 
n enteros positivos satisface la fórmula 


n(n + 1)Qn + 1) 
6 


142434 +n= 


para toda n = 1. (Verifique esto.) 
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El paso base no necesita ser para n = 1, como ilustran los dos ejemplos siguientes. 


Demuestre que n! > 2” para todos los enteros n = 4. 


Solución El paso base aquí es cuando n = 4. Claramente, la desigualdad es verdadera 
en este caso, pues 


4l =24 > 16 = 2 
Suponga que k! > 2* para algún entero k = 4. Entonces 
(k+ 1)! = (k+ 1)k! 


> (k + 1)2* por la hipótesis de inducción 
= 5.2% pues k = 4 
S Ds 2K = 2kt1 


lo que verifica la desigualdad para n = k + 1 y completa el paso de inducción. 
Se concluye que n! > 2” para todos los enteros n = 4, por el principio de inducción 


matemática. 


Si a es un número real distinto de cero y n = 0 es un entero, puede ofrecer una defi- 
nición recurrente de la potencia a” que sea compatible con la inducción matemática. Se 
define a° = 1 y, para n = 0, 

q"+! = a'a 
n veces 
A A .z n AA 
(Esta forma evita los puntos suspensivos que se usan en la versión a” = aa ++; a.) Ahora 
puede usar inducción matemática para verificar una propiedad familiar de los expo- 
nentes. 


Ejemplo B.4 


> 


m+n 


Sea a un número real distinto de cero. Demuestre que a”a” = a 
ros m,n = 0. 


para todos los ente- 


Solución A primera vista, no está claro cómo proceder, pues existen dos variables, m y 
n. Pero simplemente es necesario tener una de ellas fija y realizar la inducción usando la 
otra. De este modo, sea m = 0 un entero fijo. Cuando n = 0, se tiene 


m 


a go = q". 


al usar la definición a° = 1. Por tanto, el paso base es verdadero. 

Ahora suponga que la fórmula se cumple cuando n = k, donde k = 0. Entonces, a”a 
= a”*¥, Para n = k + 1, use la definición recursiva y el hecho de que la suma y la multi- 
plicación son asociativas, para ver que 


k 


<= da) por definición 
= (a"a)a 
=g a por la hipótesis de inducción 
= qrt por definición 


= gut) 
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Por tanto, la fórmula es verdadera para n = k + 1, y el paso de inducción está completo. 


m_n m+n 


Se concluye que a”a" = a™™” para todos los enteros m, n = 0, por el principio de in- 


ducción matemática. 


En los ejemplos B.1 al B.4, el uso de la hipótesis de inducción durante el paso de in- 
ducción es relativamente directo. Sin embargo, este no siempre es el caso. Con frecuen- 
cia es más útil una versión alternativa del principio de inducción matemática. 


Segundo principio de inducción matemática 


Sea S(n) un enunciado acerca del entero positivo n. Si 


1. S(1) es verdadero y 
2. la veracidad de S(1), S(2),..., S(k) implica la veracidad de S(k + 1) 


entonces S(n) es verdadero para toda n = 1. 


La única diferencia entre los dos principios de inducción matemática está en la hipótesis 
de inducción: la primera versión supone que S(k) es verdadera, mientras que la segunda 
versión supone que todos los S(1), S(2),..., S(k) son verdaderos. Esto hace parecer al se- 
gundo principio más débil que el primero, pues es necesario suponer más con la finali- 
dad de demostrar S(k + 1) (aunque, paradójicamente, el segundo principio en ocasiones 
se llama de inducción fuerte). Sin embargo, de hecho, los dos principios son lógicamente 
equivalentes: cada uno implica al otro. (¿Puede ver por qué?) 

El siguiente ejemplo presenta un caso donde el segundo principio de inducción ma- 
temática es más sencillo de usar que el primero. Recuerde que un número primo es un 
entero positivo cuyos únicos factores enteros positivos son 1 y él mismo. 


> 


Demuestre que todo entero positivo n = 2 es primo o puede factorizarse en un producto 
de primos. 


Solución Claramente el resultado es verdadero cuando n = 2, pues 2 es primo. Ahora 
suponga que para todos los enteros n entre 2 y k, n es primo o puede factorizarse en un 
producto de primos. Sea n = k + 1.Sik + 1 es primo, ya terminó. De otro modo, debe 
factorizarlo en un producto de dos enteros más pequeños, por decir, 


k+1=ab 
Puesto que 2 = a, b = k (¿por qué?), la hipótesis de inducción se aplica a a y b. Por tanto, 
a=9P Pp, y b=q,:"4s 
donde los p y q son todos primos. Entonces 


ab =P "Pq q; 


produce una factorización de ab en primos, lo que completa el paso de inducción. 
Se concluye que el resultado es verdadero para todos los enteros n = 2, por el se- 


gundo principio de inducción matemática. | 


662 


Apéndice B Inducción matemática 


¿Ve por qué el primer principio de inducción matemática hubiera sido difícil de usar 
aquí? Se concluye con un ejemplo enormemente no trivial que involucra una combina- 
ción de inducción e inducción hacia atrás. El resultado es la desigualdad media aritmé- 
tica-media geométrica que se estudió en el capítulo 7 en la Exploración: “Desigualdades 
geométricas y problemas de optimización”. La astuta demostración del ejemplo B.6 se 
debe a Cauchy. 


q 
Sean Xp... Xy números reales no negativos. Demuestre que 
e REE toto +x 
kotni < 
n 


para todos los enteros n = 2. 


Solución Para n = 2, la desigualdad se convierte en Vxy 5 (x + y)/2. En los proble- 
mas 1 y 2 de la Exploración mencionada anteriormente se le pide verificar esto. 

Si S(n) es la desigualdad establecida, se probará que S(k) implica S(2k). Suponga que 
S(k) es verdadero; esto es, 


ES e t 
TS 


k 
para todo número real no negativo x}, . . . , X¡. Sean 
ntn Ys t Ys Yak-1 T Yk 
x= > x= A E E 
2 2 2 
Entonces 
2k, k 
M A e > y VWY1 = Yak y V YiY2` VY2r-1Y2k 
+ + 
Je 2)... (2 1 a) por S(2) 
2 2 
=Z At 
= Xa Xk 
xi Tag 4 e g 
ga 2 % por S(k) 
k 
ntn Yək-1 F Yak 
E (5) 
E k 
Y +i E yak 
2k 
lo que verifica S(2k). 
Por tanto, la desigualdad media aritmética-media geométrica es verdadera para n = 
2,4,8,... las potencias de 2. Con la finalidad de completar la demostración, es necesa- 


rio “rellenar los huecos”. Se usará inducción hacia atrás para demostrar que S(k) implica 
S(k — 1). Si supone que S(k) es verdadero, sea 
XA ERE + X 

k=1 


Xx 
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Entonces 


kitka F de A 
ata to + € 2 t :) 


kit katet k=1 
k XX3 70" Xt k] = k 


kea + kao + e + kxe 


k(k = 1) 
_A ++ s 
k=1 


De manera equivalente, 


E Fa Fee F Xi 2 xi tao e Xi k 
AIA Sel k=1 7 k=1 


xi Ha teat aa) 


o TEEPEE hai 


Al tomar la (k — 1)-ésima raíz de ambos lados se obtiene S(k — 1). 
Las dos inducciones, tomadas en conjunto, demuestran que la desigualdad media 
aritmética-media geométrica es verdadera para toda n = 2. 


Comentario Aunque la inducción matemática es una herramienta poderosa e indis- 
pensable, no puede hacer milagros. Esto es, no puede demostrar que un patrón o fórmula 
se cumple si no lo hace. Considere los diagramas en la figura B.2, que muestran el nú- 
mero máximo de regiones R(n) en las que se puede subdividir un círculo mediante n lí- 
neas rectas. 


DOY 


R(0)=1=2 R(1)=2=2! RQ)=4=2 
Figura B.2 


Con base en la evidencia de la figura B.2, puede conjeturar que R(n) = 2" para 
n = 0y tratar de demostrar esta conjetura usando inducción matemática. No tendrá 
éxito ¡porque esta fórmula no es correcta! Si hubiera considerado un caso más, ha- 
bría descubierto que R(3) = 7 + 8 = 2?, lo que por tanto derrumba la conjetura. De 
hecho, la fórmula correcta evidencia ser 


n+n+2 


R(n) == 


que puede verificarse mediante inducción. (¿Puede hacerlo?) 

Para otros ejemplos en los que un patrón parezca ser verdadero, sólo para desapare- 
cer cuando se consideran suficientes casos, vea el delicioso artículo de Richard K. Guy, 
“The Strong Law of Small Numbers” en el American Mathematical Monthly, Vol. 95 
(1988), pp. 697-712. 


[La] extensión del concepto número 
para incluir los irracionales, y de una 
vez agregaremos los imaginarios, es el 
mayor paso hacia adelante que ha 
dado jamás la matemática pura. 
—Hermann Hankel 
Theorie der Complexen 
Zahlensysteme 
Leipzig, 1867, p. 60 


No hay nada de “imaginario” en los 
números complejos, son tan 
“reales” como los números reales. El 
término imaginario surgió del estu- 
dio de ecuaciones polinomiales 
como x? + 1 = 0, cuyas soluciones 
no son “reales” (es decir, números 
reales). Vale la pena recordar que en 
alguna época los números negativos 
también se consideraron “imagi- 
narios”. 


Jean-Robert Argand (1768-1822) fue 
un contador y matemático 
aficionado francés. Su interpretación 
geométrica de los números 
complejos apareció en 1806 en un 
libro que publicó de manera 
privada. Sin embargo, no fue el 
primero en brindar tal 
interpretación. El topógrafo 
noruego-danés Caspar Wessel 
(1745-1818) proporcionó la misma 
versión del plano complejo en 1787, 
pero su artículo no fue apreciado 
por la comunidad matemática sino 
hasta después de su muerte. 
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Apéndice G* 


Números complejos 


Un número complejo tiene la forma a + bi, donde a y b son números reales e ¡es un sím- 
bolo con la propiedad de que i? = —1. El número real a se considera un tipo especial de 
número complejo, pues a = a + 01.Siz= a + bi es un número complejo, entonces la 
parte real de z, denotada Re z, es a, y la parte imaginaria de z, denotada Im z, es b. Dos 
números complejos a + bi y c + di son iguales si sus partes reales son iguales y sus par- 
tes imaginarias son iguales; esto es, si a = c y b = d. Un número complejo a + bi puede 
identificarse con el punto (a, b) y graficarse en el plano (llamado plano complejo, o 
plano de Argand), como se muestra en la figura C.1. En el plano complejo, el eje hori- 
zontal se llama eje real y el eje vertical se llama eje imaginario. 


Im 
A 
6i + 
=A ES HT 
è l 
, 3+2 
2i + . 


-6 -4 -2 L 2 4 6 
.. =2i F 
=3 = 2 
=4i q * 
1 — 4i 
Figura 6.1 


El plano complejo 


La suma de los números complejos a + bi y c + di se define como 


(a + bi) + (c+ ae + (b + d)i 


Note que, con la identificación de a + bi con (a, b), c + di con (c, d) y (a + c) + (b + d)i 
con (a + c,b + d), la suma de números complejos es igual que la suma vectorial. El pro- 
ducto de a + biy c + dies 

(a + biy(c + di) 


alc + di) + bi(c + di) 
ac + adi + bci + bd? 


*En el sitio Web para el estudiante puede encontrar ejercicios y respuestas seleccionadas con número impar 
para este apéndice. 
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Dado que ¡? = —1, esta expresión se simplifica a (ac — bd) + (ad + bc)i. Por tanto, se 
tiene 


(a + bi)(c + di) = (ac — bd) + (ad + bc)i 


Observe que, como caso especial, a(c + di) = ac + adi, de modo que el negativo de c + 
dies —(c + di) = (—1)(c + di) = —c — di. Este hecho permite calcular la diferencia de 
a+ biyc+ di como 
(a + bi) — (c + di) = (a + bi) + (—1)(c + di) 
= (a + (—c)) + (b + (2d) 
= (a — c) + (b — d)i 


Ejemplo 6.1 


Im 
A 
z=aw+bi 
bi+ ? 
7 >Re 
—bi + 4 
pi z=a-—bi 
Figura 6.2 


Conjugados complejos 


Encuentre la suma, diferencia y producto de 3 — 4iy —1 + 21. 


Solución La suma es 


(3 — 4i) + (21+21) = (3-1) + (24 + 2)¡=2 — 21 
La diferencia es 


(3 — 4i) — (21420) = (3 - (=D) + (+4 - 2)i = 4 - 6i 


El producto es 
(3 — 41 (21 + 21) = —3 + 6i + 4i — 81? 


= —3 + 10i — 8(-1) =5 + 101 


-l 


El conjugado de z = a + bi es el número complejo 


(z se pronuncia “z barra”.) La figura C.2 brinda la interpretación geométrica del conju- 
gado. 

Para encontrar el cociente de dos números complejos, multiplique el numerador y el 
denominador por el conjugado del denominador. 


Ejemplo 6.2 


=1 +2 . 
Exprese EE en la formaa + bi. 
i 


Solución Multiplique el numerador y el denominador por 3 + 4i = 3 — 4i. Al usar el 
ejemplo C.1 se obtiene 


=1+2 -1+—2 3-4 5+10  5+101 l p2, 
= 1 


3+4 3+4 3-4 Z+ 25 505 | 


A continuación se presenta un resumen de las propiedades de los conjugados. Las de- 
mostraciones se obtienen de la definición de conjugado; debe verificarlas usted mismo. 


ld = ¡PE 


Apéndice C Números complejos 


z=a+ bi 


>b 
>Re 
a 
Figura C.3 
»—> 
Im 
A 
a+ bi 
E 
b 
0 
z >Re 


Figura C.4 


NII 
II 
N 


~ 
E 
+ 
> 
Pan 
Ni 
+ 
3| 


N 
z 
II 
N 
3 
NI E| 


4. Siz # 0, entonces o = 


NI 


v 


. zes real si y sólo si z = z. 


El valor absoluto (o módulo) |z| de un número complejo z = a + bi es su distancia 
desde el origen. Como muestra la figura C.3, el teorema de Pitágoras produce 


|z| = la + bi| = Va? + b 


Observe que 


zz = (a + biJ(a — bi) = a? — abi + bai — b?P? = a? + b’ 
Por tanto, zz = |z|? 


Esto proporciona una forma alternativa de describir el proceso de división para el co- 
ciente de dos números complejos. Si w y z # O son dos números complejos, entonces 


w WZ WZ  WZ 
Z Z zZ 


zz z 
A continuación se presenta un resumen de algunas de las propiedades del valor ab- 


soluto. (Debe tratar de demostrarlas usando la definición de valor absoluto y otras pro- 
piedades de los números complejos.) 


1. |z| = 0 siy sólo si z = 0. 
2. |z| = |z| 
3. |zw] = |z||w] 
1 1 
4. Siz + 0, entonces|-—| = —. 
z| iz 
5. z+ w| < l + |w] 


Como ya vio, el número complejo z = a + bi puede representarse geométricamente por 
el punto (a, b). Este punto también puede expresarse en términos de coordenadas pola- 
res (r, 0), donde r = 0, como se muestra en la figura C.4. Se tiene 


a=rcos0 y b=rsenó 
de modo que z=a+bi=rc0s0 + (rsen 0)i 


Por tanto, cualquier número complejo puede escribirse en la forma polar 


z = r(cos O + isen 0) 
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donde r = |z| = Va? + b? y tan O = b/a. El ángulo 0 se llama argumento de z y se de- 
nota arg z. Observe que arg z no es único: sumar o restar cualquier múltiplo entero de 277 
produce otro argumento de z. Sin embargo, sólo hay un argumento 0 que satisface 


-_Tr<0=7 


A este se le llama argumento principal de z y se denota Arg z. 


>Re 


> 
Escriba los siguientes números complejos en forma polar usando sus argumentos prin- 
cipales: 


(a) z=1+1 (b) w=1-— V3i 


Solución (a) Calcule 


t= j= Vr REV y 


1 
tan0=>=1 
1 
T a 
Por tanto, Arg z = 0 = nm (= 45°), y se tiene 
T T 
z= VA cos 7 + isen E) 
4 4 


como se muestra en la figura C.5. 


(b) Se tiene 


r= |w] = VE + (243) = V4=2 y tno- 8 3 


T 
Puesto que w está en el cuarto cuadrante, debe tener Arg z = 0 = — 3 (= 60%). Por 


tanto, 
TT . T 
w= alos -7 + isea( -2)) 
3 3 


Vea la figura C.5. 


de 


La forma polar de los números complejos se puede usar para ofrecer interpretacio- 
nes geométricas de multiplicación y división. Sean 


zı = rí[cos0, + isen 0) y z = ricos0, + isen 0,) 


Al multiplicar, se obtiene 
ZZ) = rın(cos 0, + isen 6,)(cos 0, + isen 0,) 
= rin | (cos 0; cos 0, — sen 6, sen 02) + ¡(sen 6, cos 0, + cos 0; sen 0,)] 
Al usar identidades trigonométricas 


cos(0, + 0,) = cos 0, cos 0, — sen 6, sen 0, 


sen(0, + 0,) = sen 0, cos 6, + cos 0; sen 0, 
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>Re 
Figura C.6 
p> 
Im 
A 
>Re 


Figura C.7 


se obtiene 
z12, = tir[cos(0, + 0,) + ¿sen(0, + 0,)] (1) 


que es la forma polar de un número complejo con valor absoluto rr, y argumento 0, + 
0,. Esto demuestra que 


laz] = lalla] y arg(zi22) = argz, + argz, 


La fórmula (1) dice que para multiplicar dos números complejos, se multiplican sus valo- 
res absolutos y se suman sus argumentos. Vea la figura C.6. 

De igual modo, al usar las identidades de resta para seno y coseno, es posible demos- 
trar que 


zZ r 
2 =-[cos(0, — 0) + ¡sen(0, — 0,)] siz +0 


ZA 
(Verifique esto.) Por tanto, 


21 |z] (2) 
==-— y ag e = argZ; — arg z, 


|z| 2 


Z2 


y se ve que para dividir dos números complejos se dividen sus valores absolutos y se restan 
sus argumentos. 

Como caso especial del último resultado, se obtiene una fórmula para el recíproco de 
un número complejo en forma polar. Al hacer z, = 1 (y por tanto 0, = 0) y z, = z (y por 
tanto 0, = 0), se obtiene lo siguiente 


Si z = r(cos 0 + isen 0) es distinto de cero, entonces 


1 1 ! 
— = —(cos 0 — i sen 0) 
a i 


Vea la figura C.7. 


Ejemplo C.4 


Encuentre el producto de 1 + ¡y 1 — V3i en forma polar. 


Solución A partir del ejemplo C.3 se tiene 


14 i= 12 cos + isen Z) y 1 v3i = 2( cos( z) H isen( zy) 


Por tanto, 


T T 


(+0 - V3i) = 27 cos| 2 a z) $ isa( 2 7 =) 


Vea la figura C.8. 


Abraham De Moivre (1667-1754) 
fue un matemático francés que 
realizó importantes aportaciones a 
la trigonometría, geometría 
analítica, probabilidad y estadística. 
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Ud 


(+D -— Bi) = 
as IER) 


1- Bi 


md 


Comentario Dado que (1 + i) (1 — V3i) = (1 + V3) + i(1 — V3)(compruébelo), 
debe tener 


1+ v3 = 2V2 cos( -7 ) = -2V2cos( E) 
12 12 


y ls V3=2VIsen( -7 ) = -2V5 sa( Z) 
12 12 
(¿Por qué?) Esto implica que 


(4) 22 
cos 12 BE 


Por tanto, se tiene un método para encontrar el seno y el coseno de un ángulo como 
T/12, que no es un ángulo especial, sino que puede obtenerse como una suma o diferen- 
cia de ángulos especiales. 


e 
y sen E 


Teorema de De Moivre 
Si n es un entero positivo y z = r (cos 0 + i sen 0), entonces el uso repetido de la fórmula (1) 
produce fórmulas para las potencias de z: 

z? = r cos 20 + isen 20) 

z? = zz? = r (cos 30 + isen 30) 


z* = zz? = (cos 40 + isen 40) 


En general, se tiene el siguiente resultado, conocido como teorema de De Moivre. 
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Teorema C.1 


Teorema de De Moivre 


Siz = r(cos 0 + isen 0) y n es un entero positivo, entonces 


z” = "(cos n0 + isen n0) 


Dicho de manera diferente, se tiene 


"| == 


|z |z|” y arg(z”) = nargz 


En palabras, el teorema de De Moivre dice que para calcular la n-ésima potencia de un 
número complejo, se evalúa la n-ésima potencia de su valor absoluto y su argumento se mul- 
tiplica por n. 


> 
Ejemplo C.5 Encuentre (1 + i)6. 
Solución A partir del ejemplo C.3(a) se tiene 
1+1= va( c7 F isen Z) 
4 4 
Por tanto, el teorema de De Moivre produce 
6T 6T 
(1 + 1) = (2) cos E + ¡sen mr) 
4 4 
( IM o. 2) 
= 8| cos=— + tsen —— 
2 2 
= 8(0 + i(—1)) = —81 
Vea la figura C.9 que muestra 1 + i (1+0)3101+0D3...,01+0D2 


—4 — 4i 


Figura C.9 
Potencias de 1 + i 


81 


También es posible usar el teorema de De Moivre para encontrar raíces n-ésimas de 
números complejos. Una raíz n-ésima del número complejo z es cualquier número com- 
plejo w tal que 


En forma polar se tiene 
w=s(cosp + isen ẹ) y z= r(cos0 + ¡sen 0) 


de modo que, por el teorema de De Moivre, 


s"(cos nọ + isen np) = r(cos 0 + isen 0) 


Al igualar los valores absolutos, se ve que 


n 
fer o s=" = Vr 


También se debe tener 


cosnp = cosg y senno = sen 0 


(¿Por qué?) Puesto que las funciones seno y coseno tienen cada una periodo 27r, dichas 
ecuaciones implican que ng y 0 difieren por un múltiplo entero de 277; esto es, 


0 + 2kr 


np =0+2kr o q > 
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donde k es un entero. Por tanto, 


1/n 0 + 2kr . 0 + 2km 
w=r Cos F 1sen 
n n 


describe las posibles raíces n-ésimas de z conforme k varía sobre los enteros. No es difí- 
cil demostrar que k =0,1,2,...,n — 1 produce distintos valores de w, de modo que exis- 
ten exactamente n diferentes raíces n-ésimas de z = r(cos 0 + i sen 0). Este resultado se 
resume del modo siguiente: 


Sea z = r(cos 0 + isen 0) y sea n un entero positivo. Entonces z tiene exactamente n 
distintas raíces n-ésimas dadas por 
0 + 2km (2) 
n 


1/n 0 + 2km 
f cos e + 1sen 


parak = 0,52 dle 


>Re 
=9 3 
ENF 
2 2 
Figura C.10 
Las raíces cúbicas de —27 
»—> 


Encuentre las tres raíces cúbicas de —27. 


Solución En forma polar, —27 = 27(cos m + isen T). Se tiene que las raíces cúbicas de 
—27 están dadas por 


+ 2k + 2k 
(-27) 4 = 27 cos [ EE) + isea ( 247) para k = 0,1,2 


Al usar la fórmula (2) con n = 3, se obtiene 


27 cos Z + isen z 
3 3 


270 cos ES 22) 
3 
27 cos 7 zs) 


Como muestra la figura C.10, las tres raíces cúbicas de —27 están igualmente espa- 
ciadas 27/3 radianes (120°) alrededor de un círculo de radio 3 con centro en el origen. 


a 


En general, la fórmula (2) implica que las raíces n-ésimas de z = r (cos 0 + ¡sen 6) se 
hallaran en un círculo de radio r" con centro en el origen. Más aún, estarán igualmente 
espaciados 275/n radianes (360/n°). (Verifique esto.) Por ende, si puede encontrar una 
raíz n-ésima de z, las restantes raíces n-ésimas de z pueden obtenerse al rotar la primera 
raíz en incrementos sucesivos de 27/n radianes. De haber sabido esto en el ejemplo C.6, 
podría haber usado el hecho de que la raíz cúbica real de —27 es —3 y entonces rotarla 
dos veces un ángulo de 27/3 radianes (120?) para obtener las otras dos raíces cúbicas. 
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Leonhard Euler (1707-1783) fue el más prolífico matemático de todos los tiempos. Tiene más 
de 900 publicaciones con su nombre y sus obras completas llenan más de 70 volúmenes. 
Existen tantos resultados atribuidos a él que “fórmula de Euler” o “teorema de Euler” puede 
significar muchas cosas diferentes, dependiendo del contexto. 

Euler trabajó en tantas áreas de la matemáticas que es difícil mencionarlas todas. Sus 
aportaciones al cálculo y al análisis, a las ecuaciones diferenciales, la teoría de números, la 
geometría, la topología, la mecánica y otras áreas de las matemáticas aplicadas siguen siendo 
influyentes. También introdujo gran parte de la notación que se usa en la actualidad, 
incluyendo 7, e, i, £ para suma, A para diferencia y f(x) para una función, y fue el primero en 
tratar a seno y coseno como funciones. 

Euler nació en Suiza, pero pasó gran parte de su vida matemática en Rusia y Alemania. En 
1727 se unió a la Academia de Ciencias de San Petersburgo, que fue fundada por Catalina I, 
esposa de Pedro El Grande. Viajó a Berlín en 1741 a invitación de Federico el Grande, pero 
regresó a San Petersburgo en 1766, donde permaneció hasta su muerte. Cuando era joven, 
perdió la visión en un ojo como resultado de una enfermedad, y hacia 1776 perdió la visión 
en el otro ojo y quedó totalmente ciego. Notablemente, sus resultados matemáticos no 
disminuyeron y siguió siendo productivo hasta el día de su muerte. 


En cálculo se aprende que la función e” tiene una expansión en serie de potencias 


que converge para todo número real z. Puede demostrarse que esta expansión también 
funciona cuando z es un número complejo y que la función exponencial compleja e” 
obedece las reglas usuales para exponentes. Las funciones seno y coseno también tienen 
expansiones en series de potencias: 


$ x x 
seny =x + + 

31 5! 7! 

xo x xÉ 
cosx = 1 

2! 4! 6! 


Al usar el hecho de que i? 1,1 1,1*= 1,1? = i, etcétera, que se repite en un ciclo 
de longitud 4, se ve que 


2 : xX 
er =1 +1x% + E q 


( x? xt xê ) ( A xx ) 
= 1 + zas Fail x H F iai 
2! 4! 6! 3! 51 7! 


= cosx + isen x 


| 


Este notable resultado se conoce como fórmula de Euler. 
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Teorema 6.2 


Fórmula de Euler 


Para cualquier número real x, 


e™ = cosx + isen x 


Al usar la fórmula de Euler, se ve que la forma polar de un número complejo puede 
escribirse en forma más compacta como 


z = r(cos0 + isen 0) = re” 
Por ejemplo, del ejemplo C.3(a), se tiene 
T TT . 
l+i= Val cos” + ¡sen z) = V2e'/ 


También es posible ir en la dirección contraria y convertir un exponencial complejo de 
vuelta en forma polar o estándar. 


Ejemplo C.7 


Escriba las siguientes en la forma a + bi: 


(a) e (b) e?+iT/4 


Solución (a) Al usar la fórmula de Euler se tiene 


e" = cosm + isen m = —l1 +i. 0= -1 


(Si esta ecuación se escribe como e” + 1 = 0, se obtiene la que seguramente es una de 
las ecuaciones más notables de las matemáticas. Contiene las operaciones fundamenta- 
les de suma, multiplicación y exponenciación; la identidad aditiva 0 y la identidad mul- 
tiplicativa 1; los dos números trascendentales más importantes, 71 y e; y la unidad com- 
pleja i... ¡todo en una ecuación!) 


(b) Al usar las reglas para exponentes junto con la fórmula de Euler se obtiene 


' i T T V2 V2 
e?tiTht = e?etTlt = el cos— + isen ) = e? +i 
4 4 2 2 


e? V2 n eva, 


1 
2 2 l 


Si z = re” = r(cos 0 + ¡sen 0), entonces 


z = r(cos 0 — isen 8) (3) 


Las identidades trigonométricas 


cos(—0) = cos 6 y sen(—0) = —sen O 
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permiten reescribir la ecuación (3) como 
z = r(cos(—0) + isen(—0)) = re ® 


Esto produce la siguiente fórmula útil para el conjugado: 


Siz = re”, entonces 
ze 


Nota La fórmula de Euler proporciona una rápida demostración en una línea del 
teorema de De Moivre: 


[r(cos0 + isen 0)]” = (re®)" = r"e™® = r”(cos n0 + isen n0) 


Euler ofreció la más algebraica de las 
demostraciones de la existencia de las 
raíces de una ecuación [polinominal]. . . 
Considero que es injusto acreditar esta 
demostración exclusivamente a Gauss, 
quien simplemente agregó los toques 
finales. 
—George Frobenius, 1907 
citado en el archivo MacTutor de 
Historia de las Matemáticas, 
http://www-history.mcs. 
st-and.ac.uk/history/ 


Apéndice D* 


Polinomios 
Un polinomio es una función p de una sola variable x que puede escribirse en la forma 


p(x) = a + ax + ax? + o + a,x" a) 


n 


donde ap, 4,» . . . , a, son constantes (a, # 0), llamadas coeficientes de p. Con la conven- 
ción de que 4% = 1, puede usar la notación suma para escribir p como 


p(x) = S ax" 
=0 


El entero n se llama grado de p, que se denota al escribir grado p = n. Un polinomio de 
grado cero se llama polinomio constante. 


Ejemplo D.1 


¿Cuáles de los siguientes son polinomios? 


(a) 2 — ix + v2x? (b) 2 — a (c) V 2x? 
x 
2e% x? — 5x+6 
(d) n| — (e) === (£) Vx 
e x= 2 
(g) cos(2 cos” !x) (h) e* 


Solución (a) Este es el único que obviamente es un polinomio. 


(b) Un polinomio de la forma que se muestra en la ecuación (1) no puede volverse in- 
finito conforme x tiende a un valor finito [ lim p(x) # +00], mientras que 2 — 1/3x? 


x—>c 


tiende a —oo conforme x tiende a cero. Por tanto, no es un polinomio. 
(c) Se tiene 
Vz = VIV x? = V2|x| 
que es igual a V2x cuando x = 0 y a — V2x cuando x < 0. Por tanto, esta expresión se 


forma al “empalmar” dos polinomios (un polinomio en trozos), pero no es un polinomio 
en sí mismo. 


*En el sitio Web para el estudiante puede encontrar ejercicios y respuestas seleccionadas con número impar 
para este apéndice. 
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(d) Al usar las propiedades de los exponentes y los logaritmos se tiene 


20 5x3 5 —3x 
In| =>] = In(2e™ 7 *™) = In 2 + In(e* =>) 
a 


= In 2 + 5x? — 3x = ln 2 — 3x + 5x* 


de modo que esta expresión es un polinomio. 


(e) El dominio de esta función consiste de todos los números reales x # 2. Para dichos 
valores de x, la función se simplifica a 


x? —5x+6 _ (== 3) 
x=2 x=2 


así que es posible decir que es un polinomio sobre su dominio. 


(f) Se ve que esta función no puede ser un polinomio (incluso sobre su dominio x = 0), 
pues la derivación repetida de un polinomio de la forma que se muestra en la ecuación 
(1) eventualmente resultará en cero y Vx no tiene esta propiedad. (Verifique esto.) 


(g) El dominio de esta expresión es —1 = x = 1. Sea 0 = cos”! x de modo que cos O = x. 
Al usar una identidad trigonométrica, se ve que 


cos(2 cos”! x) = cos 20 = 2cos?8 — 1 = 2x? — 1 
de modo que esta expresión es un polinomio sobre su dominio. 
(h) Al analizar esta expresión como se hizo en (f), se concluye que no es un polinomio. 


i 


Dos polinomios son iguales si los coeficientes de las correspondientes potencias de x 
son todas iguales. En particular, los polinomios iguales deben tener el mismo grado. La 
suma de dos polinomios se obtiene al sumar los coeficientes de las correspondientes po- 
tencias de x. 


Ejemplo D.2 


Encuentre la suma de 2 — 4x + x?y1+2x—x?+ 3x7. 


Solución Calcule 


(2 — 4x +x’) + (1 +2x =x’ +3x°) = (2 + 1) + (4 + 2)x 


+ (1 + (—1))x? + (0 + 3)x? 


=D E de 
donde el primer polinomio se “rellenó” al darle un coeficiente de cero a una x”. | 
La diferencia de dos polinomios se define de manera análoga, al restar coeficientes 


en lugar de sumarlos. El producto de dos polinomios se obtiene al usar repetidamente la 
ley distributiva y luego reunir las correspondientes potencias de x. 
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Encuentre el producto de 2 — 4x + x? y 1 + 2x — x? + 3x7, 


Solución Se obtiene 


(2 = 4x E E 
=2(1 +20 = x + 34%) — 4x(1 + 2x — x? + 3) 
+Hx (1 +2x=x? + 3x7) 
= (2 + 4x — 2x? + 6x7) + (—4x — 8x? + 4x? — 12x*) 
+ (x + = xt da) 
= 2 + (4x — 4x) + (—2x? — 8x? + x°) + (6x? + 4x? + 2x°) 
+(=12x* — x) + 3x 


= 2 — 9x? + 12x? — 13x* + 3x” | 


Observe que para dos polinomios p y q se tiene 
grado(pq) = grado p + grado q 


Si p y q son polinomios con grado q = grado p, puede dividir q entre p y usar divi- 
sión larga para obtener el cociente p/q. El siguiente ejemplo ilustra el procedimiento, que 
es igual para la división larga de un entero entre otro. Así como el cociente de dos ente- 
ros no es, en general, un entero, el cociente de dos polinomios no es, en general, otro po- 
linomio. 


Ejemplo D.4 


1 + 2x — x? + 3x? 
2—4x+x? ` 


Calcule 


Solución Se realizará división larga. Es útil escribir cada polinomio con potencias de- 
crecientes de x. En concordancia, se tiene 


x? — 4x + 2)3x? — x? + 2x +1 


Comience por dividir 3x° entre x? para obtener el cociente parcial 3x. Luego multiplique 
3x por el divisor x? — 4x + 2, reste el resultado y baje el siguiente término del dividendo 
(3x? — x? + 2x +1): 
3x 
x? — 4x + 2)3x— «PEL 
de — 10 + 6x 
1lx? — 4x + 1 


Luego repita el proceso con 11x, multiplique 11 por x? — 4x + 2 y reste el resultado de 
11x? — 4x + 1. Se obtiene 


3x + 11 

x2-4x+2)3x= x2+2x+ 1 
3x? — 12x? + 6x 

11x?— 4x+ 1 

11x? — 44x + 22 

40x — 21 
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Ahora se tiene un residuo de 40x — 21. Su grado es menor que el del divisor x? — 4x + 2, 
de modo que el proceso se detiene y se encontró que 


3x? — x? + 2x + 1 = (x? — 4x + 2)(3x + 11) + (40x — 21) 


3x? — x? + 2x + 1 40x — 21 
o S S 3 +11 += 
x= de + 2 x* = 4x +2 


pe 


El ejemplo D.4 puede generalizarse para producir el siguiente resultado, conocido 
como algoritmo de la división. 


Teorema D.1 Fl algoritmo de la división 


Si fy g son polinomios con grado g S grado f, entonces existen polinomios q y r tales 
que 


f(x) = g(x)q(x) + r(x) 


donde r = 0 o grado r < grado g. 


En el ejemplo D.4, 
f(x) = 3x? — x? + 2x +1, g(x) = x? — 4x + 2, q(x) = 3x + 11, 


y r(x) = 40x — 21 


En el algoritmo de la división, si el residuo es cero, entonces 


f(x) = gluJa(x) 


y se dice que g es un factor de f. (Note que q también es un factor de f.) Existe una estre- 
cha conexión entre los factores de un polinomio y sus ceros. Un cero de un polinomio f 
es un número a tal que f(a) = 0. [El número a también se llama raíz de la ecuación po- 
linomial f(x) = 0.] El siguiente resultado, conocido como teorema del Factor, establece 
la conexión entre los factores de un polinomio y sus ceros. 


Teorema D.2 Fl teorema del factor 


Sea fun polinomio y sea a una constante. Entonces a es un cero de f si y sólo six — a 
es un factor de f(x). 


Demostración Por el algoritmo de la división, 
f(x) = (x= ajal(x) + r(x) 


donde r(x) = 0 o grado r < grado (x — a) = 1. Por ende, en cualquier caso, r(x) = r es 
una constante. Ahora, 
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de modo que f(a) = 0 si y sólo si r = 0, lo cual es equivalente a 


f(x) = (x — aja(x) 


como se quería probar. —— A 


No hay un método que esté garantizado para encontrar los ceros de un polinomio 
dado. Sin embargo, existen algunos lineamientos que son útiles en casos especiales. El 
caso de un polinomio con coeficientes enteros es particularmente interesante. El si- 
guiente resultado, conocido como el teorema de raíces racionales, brinda criterios para 
que un cero de tal polinomio sea un número racional. 


Teorema D.3 


El teorema de raíces racionales 


Sea 
f(x) = ar ax Sao ax" 


un polinomio con coeficientes enteros y sea a/b un número racional escrito en térmi- 
nos más bajos. Si a/b es un cero de f, entonces a, es un múltiplo de a y a, es un múlti- 
plo de b. 


Demostración Si a/b es un cero de f, entonces 


a a n-1 a n 
Ay + a($) Jeer E ar) + a 2) =0 


Al multiplicar por b”, se tiene 
ayb" + aqab™! +--+ a, a'b + aa = 0 (1) 
lo cual implica que 
ab” + aqab™! +-+ + a, a'b = —a,a" (2) 


El lado izquierdo de la ecuación (2) es un múltiplo de b, de modo que a„a” también debe 
ser un múltiplo de b. Puesto que a/b está en términos más bajos, a y b no tienen factores 
comunes mayores que 1. Por tanto, a„ debe ser un múltiplo de b. 

La ecuación (1) también puede escribirse como 


= r n—l1 vid n—1 n 
ayb" = aab"?* +--+ + a, a"™b + aa 


»=> yun argumento similar muestra que a, debe ser un múltiplo de a. (Demuestre esto.) 
— A 
| j 
Ejemplo D.5 Encuentre todas las raíces racionales de la ecuación 
6x? + 13x?-4=0 (3) 


Solución Si a/b es una raíz de esta ecuación, entonces 6 es un múltiplo de b y —4 es un 
múltiplo de a, por el teorema de raíces racionales. Por tanto, 


ae(+1,42,+4) y be(+1,+2,+3,+6) 
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Al formar todos los posibles números racionales a/b con estas elecciones de a y b, se ve 
que las únicas raíces racionales posibles de la ecuación dada son 


+1,+2,+4+)41 4346 +: 


Al sustituir dichos valores en la ecuación (3) uno a la vez, se encuentra que —2, —5 y} 
»—> son los únicos valores de esta lista que realmente son raíces. (Compruebe esto.) Como 
verá dentro de poco, una ecuación polinomial de grado 3 no puede tener más de tres raí- 
ces, de modo que estas no sólo son todas las raíces racionales de la ecuación (3) sino tam- 


bién sus únicas raíces. 


El método de ensayo y error del ejemplo D.5 puede mejorarse en varias formas. Por 
ejemplo, una vez que encuentre una raíz a de una ecuación polinomial dada f(x) = 0, se 
sabe que x — a es un factor de f(x), por decir, f(x) = (x — a)g(x). Por tanto, puede divi- 
dir f(x) entre x — a (mediante división larga) para encontrar g(x). Puesto que grado g < 
grado f, las raíces de g(x) = 0 [que también son raíces de f(x) = 0] pueden ser más fáci- 
les de encontrar. En particular, si g(x) es un polinomio cuadrático, se tiene acceso a la 
fórmula cuadrática. 

Suponga 


ax? + bx+c=0 


(Puede suponer que a es positivo, pues multiplicar ambos lados por —1 produciría una 
ecuación equivalente de otro modo.) Entonces, al completar el cuadrado, se tiene 


n b b p? 
al ix? + =x e A Ë 
a 4a 4a 


»— (Verifique esto.) De manera equivalente, 


Por tanto, 


b b? — 4ac Vb’? -— 4ac 
x+ =+ > = 
2a da? 2a 


o _ Ne — 4ac 


3 
2a 


Vuelva a revisar la ecuación del ejemplo D.5 con la fórmula cuadrática en mente. 


Ejemplo D.6 Encuentre las raíces de 6x? + 13x? — 4 = 0. 


Solución Suponga que usa el teorema de raíces racionales para descubrir que x = —2 
es una raíz racional de 6x? + 13x? — 4 = 0. Entonces x + 2 es un factor de 6x? + 13x? — 4 
y la división larga produce 


6x7 + 13x? — 4 = (x + 2)(6 + x — 2) 
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»—> (Compruebe esto.) Ahora puede aplicar la fórmula cuadrática al segundo factor para en- 
contrar que sus ceros son 


=1+ V1 — 4(6)(-2) 


x= 
2-6 
=1 349... =1#Æ7 
12 12 


o, en términos más bajos, 1 y- Z, Por tanto, las tres raíces de la ecuación (3) son —2, a 
y —3, como se determinó en el ejemplo D.5. 


Comentario El teorema del factor establece una conexión entre los ceros de un po- 
linomio y sus factores lineales. Sin embargo, un polinomio sin factores lineales todavía 
puede tener factores de grado mayor. Más aún, cuando se pide factorizar un polinomio, 
es necesario conocer el sistema numérico al que se supone pertenecen los coeficientes de 
los factores. 


Por ejemplo, considere el polinomio 
pu) =x +1 


Sobre los números racionales Q, los únicos ceros posibles de p son 1 y — 1, por el teorema 
de raíces racionales. Una revisión rápida muestra que en realidad ninguno de ellos fun- 
ciona, de modo que p(x) no tiene factores lineales con coeficientes racionales, por el teo- 
rema del factor. Sin embargo, p(x) todavía puede factorizarse en un producto de dos cua- 
dráticas. Los factores cuadráticos se verificarán usando el método de coeficientes 
indeterminados. 

Suponga que 

xt + 1 = (x? + ax + b)\(x? + cx + d) 


»—> Al expandir el lado derecho y comparar coeficientes, se obtienen las ecuaciones 


a+c=0 

b+ac+d=0 

bc + ad = 0 

bd = 1 
Si a = 0, entonces c = 0 y d = —b. Esto produce —b? = 1, que no tiene soluciones en Q. 
Por tanto, puede suponer que a # 0. Entonces c = —a y se obtiene d = b. Ahora se tiene 
que b? = 1, de modo que b = 1 o b = —1. Esto implica que a? = 2 o a? = —2, respecti- 


vamente, ninguno de los cuales tiene solución en Q. Se concluye que x* + 1 no puede 
factorizarse sobre Q. Se dice que es irreductible sobre Q. 

Sin embargo, sobre los números reales R, x* + 1 sí se factoriza. Los cálculos recién rea- 
lizados demuestran que 


xt + 1 = (x? + V2x + 1)? — V2x + 1) 


»—> (¿Por qué?) Para ver si es posible factorizar aún más, aplique la fórmula cuadrática. Se ve 
que el primer factor tiene ceros 


x 


_IV2+VW(V2?=4_-V24V-2_ v2 
2 


1 1 
3 > (Ltd) = += 


V2 v2 
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Figura D.1 


que están en C mas no en RR. Por tanto, x? + V2x + 1 no puede factorizarse en facto- 
res lineales sobre R. De igual modo, x? — W2x + 1 no puede factorizarse en factores li- 
neales sobre R. 

Los cálculos demuestran que una factorización completa de x* + 1 es posible sobre 
los números complejos C. Los cuatro ceros de x* + 1 son 


1 1 1 1 1 1 
a + i a i -a =— +i, 
V2 v2 V2 v2 V2 v2 

1 1. 

a = 1 

V2 v2 


que, como muestra la figura D.1, todas están en el círculo unitario en el plano complejo. 
Por tanto, la factorización de x* + 1 es 


X +1 = (x -— a)(x ax + ax + a) 


El comentario anterior ilustra muchas propiedades importantes de los polinomios. 
Note que el polinomio p(x) = x* + 1 satisface grado p = 4 y tiene exactamente cuatro 
ceros en C. Más aún, sus ceros complejos ocurren en pares conjugados; esto es: sus ceros 
complejos pueden parearse como 


{aa} y fa ==] 


Estos dos últimos hechos son verdaderos en general. El primero es un ejemplo del teo- 
rema fundamental del álgebra (TFA), un resultado que Gauss demostró por primera 
vez en 1797. 


Teorema D.4 


El teorema fundamental del álgebra 


Todo polinomio de grado n con coeficientes reales o complejos tiene exactamente n 
ceros (contando multiplicidades) en C. 


Este importante teorema en ocasiones se enuncia como 
“Todo polinomio con coeficientes reales o complejos tiene un cero en C.” 


Llame a este enunciado TFA’. Ciertamente, TFA implica TFA’. Por el contrario, si TFA’ es 
verdadero, entonces, si se tiene un polinomio p de grado n, tiene un cero «y en C. El teorema 
del factor dice entonces que x — « es un factor de p(x), de modo que 


p(x) = (x= a)q(x) 


donde q es un polinomio de grado n — 1 (también con coeficientes reales o complejos). 
Ahora puede aplicar TFÆ a q para obtener otro cero y así por el estilo, lo que hace ver- 
dadero a TFA. Este argumento puede convertirse en una agradable prueba de inducción. 
(Inténtelo.) 

No es posible dar una fórmula (a lo largo de las líneas de la fórmula cuadrática) para 
los ceros de polinomios de grado 5 o más. (El trabajo de Abel y Galois confirmó esto; vea 
la página 322.) En consecuencia, deben usarse otros métodos para probar TFA. La de- 
mostración que proporcionó Gauss usa métodos topológicos y puede encontrarse en 
cursos de matemáticas más avanzados. 

Ahora suponga que 


p(x) = ao + ax ++ + a,x" 


n 


Descartes enunció esta regla en su 
libro de 1637 La Geometrie, pero 
no ofreció una demostración. Más 
tarde, varios matemáticos propor- 
cionaron una demostración y 
Gauss ofreció una versión un poco 
más precisa del teorema en 1828. 
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es un polinomio con coeficientes reales. Sea œ un cero complejo de p de modo que 
Ad) + aa +: + aa = pa) =0 

Entonces, al usar las propiedades de los conjugados, se tiene 

n 


Pa) =a taat + aa" = mtaa Haa 


n 


a)=0=0 


II 
3 
T 


Por tanto, a también es un cero de p. Esto demuestra el siguiente resultado: 


Los ceros complejos de un polinomio con coeficientes reales se presentan en pares 
conjugados. 


En algunas situaciones no es necesario saber cuáles son los ceros de un polinomio, 
sólo es necesario saber dónde se ubican. Por ejemplo, acaso sólo sea necesario conocer si 
los ceros son positivos o negativos (como en el Teorema 4.35). Un teorema que es útil en 
este aspecto es la regla de los signos de Descartes. Ello permite hacer ciertas predicciones 
acerca del número de ceros positivos de un polinomio con coeficientes reales con base en 
los signos de dichos coeficientes. 

Dado un polinomio a, + a,x + +: + a, x”, escriba en orden sus coeficientes distin- 
tos de cero. Sustituya cada coeficiente positivo con un signo más y cada coeficiente ne- 
gativo con un signo menos. Se dirá que el polinomio tiene k cambios de signo si existen 
k lugares donde los coeficientes cambian de signo. Por ejemplo, el polinomio 2 — 3x + 
4x + x* — 7x7 tiene el patrón de signos 

+-++- 


de modo que tiene tres cambios de signo, como se indicó. 


Teorema D.5 


Regla de los signos de Descartes 


Sea p un polinomio con coeficientes reales que tiene k cambios de signo. Entonces el 
número de ceros positivos de p (contando multiplicidades) es cuando mucho k. 


En palabras: la regla de los signos de Descartes dice que un polinomio real no puede 
tener más ceros positivos que cambios de signo. 


Ejemplo D.7 


> 
Demuestre que el polinomio p(x) = 4 + 2x? — 7x* tiene exactamente un cero positivo. 


Solución Los coeficientes de p tienen el patrón de signos + + —, que sólo tiene un 
cambio de signo. De modo que, por la regla de los signos de Descartes, p tiene cuando 
mucho un cero positivo. Pero p(0) = 4 y p(1) = —1, de modo que hay un cero en alguna 
parte en el intervalo (0, 1). En consecuencia, este es el único cero positivo de p. 
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También puede usar la regla de los signos de Descartes para dar una cota sobre el nú- 
mero de ceros negativos de un polinomio con coeficientes reales. Sea 


p(x) = a + ax + ax? +: + ax" 
y sea b un cero negativo de p. Entonces b = —c para c > 0 y se tiene 


0 = p(b) = ay + ab + ab? + + a,b" 


a — ac + ac? + + (—1)"a,c" 


Pero pl—x) = a, — a t ax? — d (=) aa 


de modo que c es un cero positivo de p(—x). Por tanto, p(x) tiene exactamente tantos 
ceros negativos como p(—x) tiene ceros positivos. Combinada con la regla de los signos 
de Descartes, esta observación produce lo siguiente: 


Sea p un polinomio con coeficientes reales. Entonces el número de ceros negativos de 
p es cuando mucho el número de cambios de signo de p(—x). 


Ejemplo D.8 Demuestre que los ceros de p(x) = 1 + 3x + 2x? + x? no pueden ser todos reales. 


Solución Los coeficientes de p(x) no tienen cambios de signo, de modo que p no tiene 
ceros positivos. Puesto que p(—x) = 1 — 3x + 2x? — x’ tiene tres cambios de signo entre 
sus coeficientes, p tiene cuando mucho tres ceros negativos. Note que 0 tampoco es un 
cero de p, de modo que p tiene cuando mucho tres ceros reales. Por tanto, tiene al menos 


dos ceros complejos (no reales). | 


Respuestas a ejercicios 
impares seleccionados 


Las respuestas son sencillas. Plantear las preguntas 


correctas [es lo que es] difícil 


Capítulo 1 
Ejercicios 1.1 
1 y 
A 


3. (a), (b) z 


—Doctor Who 
“The Face of Evil” 
Por Chris Boucher 

BBC, 1977 


(d) E 
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(1 + V3)/2 
(1 + V3)/2 


(c) y 
A 
SS 
m Hije 
=2 i 2 
(d) y 
A 
EL 
2 
1] AN 
3 
1] 
6 
| | rx 
Y 1 1 
6 6 3 
7.a + b= [5,3] 
y 
A 
4+ 
11. [3, —2, 3] 

E 1/2] _ [-v3/2 
a= f ahv] e 
A 
-=p > 
15. 5a 
17. x = 3a 


[u+v= 


25. 


27. 
29. 


31. 
35. 
39. 
43. 
47. 


51. 
55. 
57. 


y 
A 
2+ 
| e S 
J: 2 4 6 
—2 + 
w = —2u + 4v 
y 
A 
E 
4 6 
=2 + 
u+v= 


u 

+ 

0 

1 

2 

3 

0 

0 

3 

3,2 45.x =2 
No hay solución 49.x=3 


No hay solución 53.x=2 

x=lox=5 

(a) Todaa + 0 (b)a=1,5 

(c) a y m no pueden tener factores comunes distintos de 


1 [esto es, el máximo común divisor (mcd) de a y m 
es 1.] 


Ejercicios 1.2 


l. 


Le 


=1 3.11 5.2 
1/ V14 

| 
vs.| 2/15 9. V14, | 2/V14 


3/ V14 


11. V6, [1/V6, 1/V3, 1/V2, 0] 
13. V17 15. V6 
17. (a) u- v es un escalar, no un vector. 


(c) v- w es un escalar y u es un vector. 


19. Agudo 21. Agudo 23. Agudo 
25. 60° 27. =88.10" 29. =14.34° 
—4 1 
— > 
31. Puesto que AB + AC = 1 j| 1| = 0, BAC es un 
=] =3 


ángulo recto. 


33. Si se toma el cubo como un cubo unitario (como en la 
figura 1.34), las cuatro diagonales están dadas por los 


vectores 
1 1 =1 1 
d; = 1 ‚d, = 1 , d, = 1 ,d, = =] 
1 =1 1 1 


Dado que d; + d; 0 para toda i 4 j (seis posibilidades), 
ningún par de diagonales es perpendicular. 
35. D = (-2,1,1) 


37. 5 mi/h a un ángulo de = 53.13” hacia la orilla 


39. 60° 
3 
E 3 0.301 
aj | 43. 5 45. | 0.033 
3 A 0.252 
E 
47. A = V45/2 49. k = — 


51. v es de la forma l J donde k es un escalar. 
—a 


53. Se violaría la desigualdad de Cauchy-Schwarz. 


Ejercicios 1.3 


1. (a) Pi =0 (b)3x+2y=0 


y 
x 1 =] 
Ái Lo a 
a 
y= 3t 
x t 
5. (a) | y e. =. 
z z= 4t 


7. (a) =2 (b)3x+2y+z=2 


= N U 
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x 2 3 
9 (a) |y| =s|1| ++ 2 
z 2 1 
(b) x = 2s — 3t 
y= s+2t 
z=2s+ t 
nel- [+ 
y =2 2 
x 1 3 =1 
13. |y|=|1|+s|-1|++é 0 
4 1 1 =? 


15. (a) x = = +t 
y=-1+ > y =l 3 


17. Los vectores directores para las dos recta están dados 
1 1 
por d, = | | yd, = | | Las rectas son perpendicu- 
m m, 


lares si y sólo si d, y d, son ortogonales. Pero d; + d, = 0 
si y sólo si 1 + m,m, = 0 o, de manera equivalente 
mm, = =l. 

19. (a) Perpendicular 
(c) Perpendicular 


ala 


(b) Paralelo 
(d) Perpendicular 


x -1 —1 
23. | y |= 0|++%é 3 
Zz 3 =] 


25. (a) x= 0,x = 1,y =0,y=1,z=0,z=1 


(b) x-y=0 ()x+y=z=0 
17132 29. 2V3/3 3) 
33. (4,4,8) 35. 18V13/13 37.3 
43. =78.9° 45. =80.4° 


Ejercicios 1.4 
1. 13 N a aproximadamente N 67.38 E 
3. 8V3Naun ángulo de 30° hacia f, 
5. 4N a un ángulo de 60° hacia f, 
7 


. 5N a un ángulo de 60° a la fuerza dada, 5V3 N 
perpendicular hacia la fuerza de 5 N. 


9. 750V2 N 


11. 980 N 


13. = 117.6 N en el alambre de 15 cm, = 88.2 N en el 
alambre de 20 cm 


15. [1,0,1,1,1] 


17. No hay error 
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19. No hay error 19. [7,3] 21. (2,1, Y] 
21. d=2 23. [5, —2, 1, 1] 25. [2, —7, —32] 
23. d=0 i =i 1 5|-1 
27. d=0 27.|) 1 o . | 1|-5 
31. d=X li Mo 
33. (b)  [0,4,4,9,9,0, 8, 3,5, 6] 31. ne prs 33. [1,1] 
35. (b)  [0, 3,8,7, 0,9,9,0, 2,6] Ea 1 
35. [4, —1] 37. No hay solución 
Preguntas de repaso 39. (a) 2x+ y=3 (b) x=} — Is 
(a) V OF AV QF QV dx +2y=6 y=s 
8 =2/V5 41. A La solución es x =3,y = —3. 
3.x= | | 5. 120° 7| AN x y 
11 43. Sean u = tan x, v = sen y, w = cos z. Una solución es 


9.2x+3y-=z2=7 11. V6/2 x= 1/4, y = =11/6,2 = 1/3. (Existe un número in- 


13. Se violaría la desigualdad de Cauchy-Schwarz finito de soluciones.) 


15. 2V6/3 17.%=2 19. 3 Benine 
1. No 3. Forma escalonada reducida por 
Capítulo 2 renglón 
Ejercicios 2.1 5. No 7. No 
1. Lineal 3. No es lineal debido al término x~! 1 1 1 1 0 
5. Lineal 7.2x + 4y=7 9. (a) |0 1 1 11. (b) |O 1 
9.x + y = 4(x, y # 0) 00a En 
4 — 2s — 3t 1.0 =1 
11. fel 13. Ss 13.(b)|0 1 —1 
t 0 0 0 
15. Solución única, x = 3, y = =3 15. Realice operaciones elementales con renglón en el orden 


R, + 29R,,8R,, R, — 3R, R, 4> Ry R, — Ry R3 + 2R,, 
y, finalmente, R, + 2R}. 

17. Una posibilidad es realizar operaciones elementales con 
renglón sobre A en el orden R, — 3R,,3R»,R, + 2R, R, 
+ 3R, R&R. 

19. Sugerencia: escoja una matriz aleatoria de 2 X 2 e in- 
tente esto, ¡cuidadosamente! 


21. En realidad estas son dos operaciones elementales con 
renglón combinadas: 3R, y R, — 2R}. 


23. Ejercicio 1: 3; ejercicio 3: 2; ejercicio 5: 2; ejercicio 7: 3 


2 1 
25.15 27.t| 1 | a 
1 1 = 
24 6 0 12 
—10 —2 6 —6 
31. Ol+r| 1|+s|0|++é| 0 
L 0 0 1 0 
0 0 0 1 


33. 
35. 
37. 
39. 


41. 


43. 


45. 


49. 


51. 


No hay solución 
Solución única 
Número infinito de soluciones 


Sugerencia: demuestre que si ad — bc # 0, el rank de 


a b 
ES el es 2. (Existen dos casos: a = 0 y a # 0.) Use 


el teorema del rank para deducir que el sistema dado 
debe tener una solución única. 

(a) No hay solución si k = —1 

(b) Una solución única si k 4 +1 

(c) Número infinito de soluciones si k = 1 


(a) No hay solución si k = 1 

(b) Una solución única si k 4 —2, 1 

(c) Número infinito de soluciones si k = —2 
x 0 9 
y|=|-1|++| -10 
A 1 =7 

No hay intersección 


X1 
Los vectores requeridos x = | x, | son las soluciones del 
X3 
sistema homogéneo con matriz aumentada 


le Uu U3 o] 
0 


VY Y 
Por el Teorema 3, existe un número infinito de solu- 
ciones. Si u 4 0 y uv, — u,v; % 0, las soluciones están 
dadas por 


UW3 — U3V, 
t| uv; — UV; 

Uv = 

Pero una comprobación directa demuestra que éstas toda- 
vía son soluciones incluso si 4, = 0 y/o uv, — uv; = 0. 


UV: 


1 
0 3 
53. | | 55. |0 57: | 
2 3 
0 
Ejercicios 2.3 
1. Sí 3. No 5. Sí 7. Sí 
9. Es necesario demostrar que la ecuación vectorial 


1 1 


los valores de a y b. Esta ecuación vectorial es equiva- 
lente al sistema lineal cuya matriz aumentada es 


f lla 
1 —-1|b 


1 1 aj . sy 
d | + y i | = la tiene una solución para todos 


| La reducción por renglón produce 


11. 


17. 
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a 


f 1 

0 —2|b=a 
una solución (única). [Más operaciones con renglón 
producen x = (a + b)/2, y = (a — b)/2.] Por tanto, R? 


-="((1-1)) 


Es necesario demostrar que la ecuación vectorial 
1 1 0 a 
xpO0|+y|1|+2z|1|=| b | tiene una solución para 
1 0 1 Cc 


todos los valores de a, b y c. Esta ecuación vectorial es 
equivalente al sistema lineal cuya matriz aumentada es 


1 1 Oja 


de donde se puede ver que existe 


0 1 1|b|.La reducción por renglón produce 

1 0 Ice 

1.1.0 a 

0 1 1 b , de donde puede ver que existe 
0 0 2[b+c=a 


una solución (única). [Más operaciones con renglón 


producen x = (a — b + c)/2,y = (a + b — c)/2, z = 
(=a +b + c)/2.] 
1 1 0 
Por tanto, R = gen| |0|,| 11, 
1 0 1 
. (a) La recta a través del origen con vector director 
=] 
2 


(b) La recta con ecuación general 2x + y =0 


. (a) El plano que pasa por el origen con vectores 


1 3 
directores | 2 |, 2 
0 1 


(b) El plano con ecuación general 2x — y + 4z = 0 
La sustitución produce el sistema lineal 
a +3c=0 


=a+b=3c=0 
=3 
cuya solución es t| 0 |. Se tiene que existe un número 
1 


infinito de soluciones, siendo acaso la más simple 
a=-3,b=0,c=1. 
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19. u = u + O(u + v) + O(u + v + w) 
v = (—1)u + (u + v) + O(u + v + w) 
w = 0u + (—1)(u + v) + (u+v+w) 


21. (c) Debe demostrar que gen(e,, e, e,) = gen(e,, €; + e, 
e, + e, +e). Se sabe que gen(e,,e, + e, e, te + 
e,) C R? = gen(e,, e,, es). Del ejercicio 19, e}, e, y e, 
todos pertenecen a gen(e,, e, + e, 
e, + e, + ey). Por tanto, por el ejercicio 21(b), 
gen(e,, e, €) = gen(e,, e, + e, e, + e, + ey). 


23. Linealmente independiente 


0 2 2 
25. Linealmente dependiente, —| 1|+|1|=]|0 
2 3 1 


27. Linealmente dependiente, puesto que el conjunto con- 
tiene el vector cero 


29. Linealmente independiente 


3 =i =] 
z ; =] 3 =1 
31. Linealmente dependiente, i + a + Miz 
1 -1 -1 3 
1 
3 
1 
43. (a) Sí (b) No 
Ejercicios 2.4 


1. x, = 160, x, = 120, x, = 160 
3. dos pequeños, tres medianos, cuatro grandes 
5. 65 bolsas de mezcla de la casa, 30 bolsas de mezcla espe- 
cial, 45 bolsas de mezcla gourmet 
7. 4FeS, + 110, —> 2Fe,0, + 880, 
9. 2C¿H,o + 130, —> 8C0, + 10H,O 
11. 2C,¿H,,OH + 150, —> 12H,0 + 10CO, 
13. Na,CO, + 4C + N, —> 2NaCN + 3CO 
15. (a) f = 30-t (b)f, =15,f, =15 
f. =-10+t 
f: = t 
(c) 0=f,=20 
0=f,=20 
10 = f; = 30 
(d) Flujo negativo significaría que el agua fluye hacia 
atrás, contra la dirección de la flecha. 
17. (a) fi = —200 +s +t (b) 200 = f = 300 


f= 300-s-t 
h= s 
fi= 150 =b 


f= t 


19. 
21. 


23. 
25. 


27. 


29. 


31. 


33. 


(c) Sif, = s = 0, entonces f; = t = 200 (de la ecuación 
fi) pero fs = t = 150 (de la ecuación f,). Esto es una 
contradicción. 

(d) 50 = f} = 300 

I = 3 amps, lL, = 5 amps, I, = 2 amps 

(a) I = 10 amps, l, = I; = 6 amps, L, = I, = 4 amps, 
L = 2 amps 

(b) Rg = 7 ohms 

(c) Sí; lo cambia a 4 ohms. 

Agrícola: Manufacturera = 2: 3 

El pintor cobra $39/h, el plomero $42/h, el electricista 

$54/h. 

(a) El carbón debe producir $100 millones y el acero 
$160 millones. 

(b) El carbón debe reducir la producción en = $4.2 
millones y el acero debe aumentar la producción 
en = $5.7 millones. 

(a) Sí; presione los interruptores 1, 2 y 3 o los interrup- 
tores 3, 4 y 5. 

(b) No 

Los estados que pueden obtenerse se representan 

mediante estos vectores 


en Z para el cual x, + x, + x4 + x; = 0. 
(Existen 16 de tales posibilidades.) 
Si 0 = apagada, 1 = azul claro y 2 = azul oscuro, en- 


tonces el sistema lineal que surge tiene matriz aumen- 
tada 


1 1 0 0 0/2 
1 1 1 0 0|1 
0 1 1 1 0/2 
0.0 1 1 1/1 
0 0 0 1 1/2 
que se reduce sobre Z, a 
1 0 0 O 1jl 
0 1 0 O 2|1 
0 0 1 0 0/2 
0 0 0O 1 1[2 
0 0 0 0 0/0 


Esto produce las soluciones 


Xx] 


X5 0 


donde t está en Z,. Por tanto, existen exactamente tres 
soluciones: 


donde cada entrada indica el número de veces que debe 
oprimir el interruptor correspondiente. 


Ejercicios 2.5 
ln 0 1 2 3 4 5 
x, 0 0.8571 0.9714 0.9959 0.9991 0.9998 


x, 0 0.8000 0.9714 0.9943 0.9992 0.9998 


Solución exacta: x, = 1, x, = 1 
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35. (a) Oprima los cuadrados 3 y 7. 

(b) La matriz de coeficientes A de 9 X 9 es equivalente 
por renglones a Z,, de modo que para cualquier b 
en Z2, Ax = b tiene una solución única. 

37. Grace tiene 15 y Hans 5. 

39. 1200 y 600 yardas cuadradas. 

41. (a) a=4-—d,b=5-—d,c= 
(b) No hay solución 

43. (a) No hay solución 

(b) [a, b, c, d, e, f] = [4, 5,6, —3, —1,0] + 

$ [=1,=1,=1,1, 1,1] 
45. (a) y=x?—2x+1 
47.A=1,B=2 
49. A 


2 + d,d es arbitrario 


(b) y =x?+6x + 10 


0, D Ea 3 


3. aO 2 3 4 5 6 


x, 0 0.2222 0.2539 0.2610 0.2620 0.2622 0.2623 
x, 0 0.2857 0.3492 0.3582 0.3603 0.3606 0.3606 


Solución exacta (a cuatro lugares decimales): x, = 
0.2623, x, = 0.3606 


5n 0 1 2 3 4 5 6 7 8 
x 0 0.3333 0.2500 0.3055 0.2916 0.3009 0.2986 0.3001 0.2997 
x 0 0.2500 0.0834 0.1250 0.0972 0.1042 0.0996 0.1008 0.1000 
x, 0 0.3333 0.2500 0.3055 0.2916 0.3009 0.2986 0.3001 0.2997 
Solución exacta: x, = 0.3, x, = 0.1, x, = 0.3 

7. n 0 1 2 3 4 9. n 0 1 2 3 4 
x 0 0.8571 0.9959 0.9998 1.0000 xı 0 0.2222 0.2610 0.2622 0.2623 
x, 0 0.9714 0.9992 1.0000 1.0000 x, 0 0.3492 0.3603 0.3606 0.3606 


Después de tres iteraciones, el método de Gauss-Seidel 
está dentro de 0.001 de la solución exacta. El método 
de Jacobi requiere cuatro iteraciones para alcanzar la 
misma precisión. 


Después de tres iteraciones, el método de Gauss-Sei- 
del está dentro de 0.001 de la solución exacta. El 
método de Jacobi requiere cuatro iteraciones para al- 
canzar la misma precisión. 
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Mon 0.1 2 3 4 5 6 Wo a 
x 0 0.3333 0.2777 0.2962 0.2993 0.2998 0.3000 11 
Xx, 0 0.1667 0.1112 0.1020 0.1004 0.1000 0.1000 T 
x 0 0.2777 0.2962 0.2993 0.2998 0.3000 0.3000 
0.57 
Después de cuatro iteraciones, el método de Gauss-Seidel T 
está dentro de 0.001 de la solución exacta. El método de E HH 11 
Jacobi requiere siete iteraciones para alcanzar la misma 0.5 1 
precisión. 
15. n 0 1 2 3 4 
x 0 3 -5 19 —53 
x, 0 -4 8 —28 80 
Si las ecuaciones se intercambian y se aplica el método 
de Gauss-Seidel al sistema equivalente 
3x1, + 2% = 1 
x% — 2% = 3 
se obtiene 
n 0 1 2 3 4 6 7 8 
Xi 0 0.3333 1.2222 0.9260 1.0247 0.9918 1.0027 0.9991 1.0003 
Xx) 0 1,3339 — 0.8889 — 1.0370 —0.9876 — 1.0041 —0.9986 — 1.0004 —0.9998 
Después de siete iteraciones, el proceso converge hasta 
dentro de 0.001 de la solución exacta x, = 1, x, = —1. 
17. E 19. n 0 1 2 3 4 5 6 
x 0 =1.6 14.97 8.550 10.740 9.839 10.120 
x, 0 25,9 11.408 14.051 11.615 11.718 11.249 
xs 0O —10.35 =9.311 —11.200 —11.322 —11.721 —11.816 
ai n 7 8 9 10 11 12 
Xx; 9.989 10.022 10.002 10.005 10.001 10.001 
X, 11.187 11.082 11.052 11.026 11.015 11.008 
x, —11912 —11.948 —11.973 —11.985 —11.992. —11.996 


Después de 12 iteraciones, el método de Gauss-Seidel 
converge dentro de 0.01 de la solución exacta 


12. 


x, =10,x, = 11, x, 
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21. n 13 14 15 16 
X 10.0004 10.0003 10.0001 10.0001 
X, 11.0043 11.0023 11.0014 11.0007 
X3 -11.9976 —11.9986 —11.9993 —11.9996 
23. El método de Gauss-Seidel produce 
n 0 1 2 3 4 5 6 7 8 9 
Xy 0 0 12.5 21.875 24.219 24.805 24.951 24.988 24.997 24.999 
X3 0 0 18.75 21.438 24.609 24.902 24.976 24.994 24.998 24.999 
X3 0 50 68.75 73.438 74.609 74.902 74.976 74.994 74.998 74.999 
X4 0 62.5 71.875 74.219 74.805 74.951 74.988 74.997 74.999 75.000 
La solución exacta es x, = 25, x, = 25,%; = 75, x4 = 75. 
25. El método de Gauss-Seidel produce las siguientes iteraciones: 
n 0 1 2 3 4 5 
ti 0 20 21.25 22.8125 23.3301 23.6596 23.7732 
f 0 5 11.25 13.3203 14.6386 15.0926 15:2732 
A 0 21.25 24.6094 26.9873 27:1303 27.9626 28.0352 
La 0 2.5 5.8594 8.2373 8.9804 9.2126 9.2852 
f 0 7.1875 14.6289 16.2829 16.7578 16.9036 16.9491 
A 0 23.0469 24.9072 25.3207 25.4394 25.4759 25.4873 
n 7 8 9 10 11 
t, 23.8093 23.8206 23.8242 23.8252 23.8256 23.8257 
b 15.2824 15.2966 15.3010 15.3024 15.3029 15.3029 
t; 28.0579 28.0650 28.0671 28.0678 28.0681 28.0681 
ty 9.3079 9.3150 9.3172 9.3178 9.3181 9.3181 
A 16.9633 16.9677 16.9690 16.9695 16.9696 16.9696 
te 25.4908 25.4919 25.4922 25.4924 25.4924 25.4924 
Xx 
27. (a) n 0 1 2 3 4 5 6 A 
0 0 3 3 E KK & 
1 1 3 3 11 11 
X2 1 2 a $ $ 32 32 


694 Respuestas a ejercicios impares seleccionados 


(b) 2x3 + x=1 


x +2% =1 

() n 0 1 p 3 4 5 
X 0 0 0.25 0.3125 0.3281 
x 1 05 0.375 0.3438 0.3360 


[Las columnas 1, 2 y 3 de esta tabla son las columnas 
impares 1, 3 y 5 de la tabla en el inciso (a). Las itera- 
ciones convergen en x, = x, = 0.3333. 

(d) x =% =3 


Preguntas de repaso 


1. (a) F (c) F (e) V (g) V (i) F 
0 
3. 2 5. 5 7.k =—1  9.(0,3,1) 
—1 
1.x —2y+z=0 13. (a) Si 15.102 


17. Si c(u + v) + c{u — v) = 0, entonces (c, + c )u + (c, — 
c,) v = 0. La independencia lineal de u y v implica c, + 
c, = 0 y c, — c, = 0. Al resolver este sistema, se obtiene 
c, = G = 0. Por tanto, u + vyu — v son linealmente in- 
dependientes. 


19. Sus rangos deben ser iguales. 


Ejercicios 3.1 


-4 -2 
9. [10] 11. | 
|8 4 
0-00 1.27 0 
13.10 0 0 15. | 
[—49 125 
0.0.0 
1 


1.50 1.00 2.00 650.00 462.50 
19. B = , = 


1.75 1.50 1.00 675.00 406.25 


La columna i corresponde al almacén :, el renglón 1 
contiene los costos de embarque por camión y el 
renglón 2 contiene los costos de embarcar por tren. 


0.3320 
0.3340 


6 7 
0.3330 0.3332 
0.3335 0.3334 
X1 
A A 
21. x% | = 
2 L =5 4 
X3 
23. AB = |2a; + a, — az 3a, — a, + 6a; a, + 4a;] 
(donde a; es la i-ésima columna de A) 
2 3 0 0 0 0 2 =12 =8 
25. 6 9 0|+|1 1 1|+|-1 6 4 
4 6 0 0 0 0 1 —6 -4 
2A, + 3A, 
27. BA = A; TA, +A; (donde A, es el i-ésimo 


—A, + 6A, + 44; 
renglón de A) 


29. Si b; es la ¡-ésima columna de B, entonces Ab, es la i- 
ésima columna de AB. Si las columnas de B son lineal- 
mente dependientes, entonces existen escalares C,,..., €, 
(no todos cero) tales que cb; +++: + c,b, = 0. Pero en- 


non 


tonces c,(Ab,) +: + c, (Ab,) = A(c,b, +: + c b,) = 


A0 = 0, de modo que las columnas de AB son lineal- 
mente dependientes. 


3 2ļ|0 
31.|—1 1|0 33. 
o o0ol5 
aa] 
35. (a) A? = „4 = 
L—1 0] 
E 0 e 1 a 
1-1] 1 1) 
7 
y= o 1 
=1 1] 


(b) 4201 = 


lo on 
37. A" = | | 
0 1 


I =l 1 =1 00 0 0 

39. (a) =] 1. =l 1 (c) 11 11 
I = p = 2 4 8 16 

=í I =I 1 3 9 27 81 


Ejercicios 3.2 
5 4 A 
all | x= E | 
3 5 2 4 
5.B=2A +4, 7. No es posible 


9. 


c 26, TG 
gen(A, A2) = il f ! i B 
=ġ +20) åt 


| w x 
Ma, um) 
11. gen(A;, Az, A3) = 
pa 20: Cs =G +6 )- 
Ll. 0 ato 0 | E 
(e + 4c+5e b o) 
L 0 e 0 
13. Linealmente independiente 
15. Linealmente independiente 
23.a=dc=0 25.3b=2ca=d-=c 
27.a=db=c=0 
29. Sean A = la] y B = [b;] matrices triangulares superiores 
de n X n y sea i > j. Entonces, por la definición de ma- 
triz triangular superior, 
A = Ap =t 5 ai- 50 y 
b; = ba = = p= 
Ahora sea C = AB. Entonces 
cj = apb + apb + +8, ia F ab; 
A HU + Ainbyj 
= 0-bj + 0-b +: 0-b; + a0 
Fatt Pe aym 
de donde se concluye que C es triangular superior. 
35. (a) A, B simétrica = (A + B)" = A" + B' = 
A + B = A + B es simétrica 
37. Las matrices (b) y (c) son antisimétricas. 
41. A o B (o ambas) deben ser la matriz cero. 
1.2 3 LS 5 0 =I =2 
43. (b) |4 5 6|=|3 5 7|+|1 0 -1 
7 8 9 57 9 2 1 0 
47. Sugerencia: use la traza. 
Ejercicios 3.3 
1: a el 3. No es invertible 
| =1 + 
a e Fi 
5. No es invertible 7. = 
0.3 1 
ð | a (a +b’) b/(a + 2 i | 5 
"| —b/(a? + b’) a/(a? + b?) 9 


pal 
Qu 


25. 


29. 


33. 


39. 


43. 


45. 


47. 
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4 -5 6 
| ipae ahea 


(c) El método en el inciso (b) usa menos 
multiplicaciones 


. (b) (AB)* = A7'B” si y sólo si AB = BA 
. X = A '(BAYB' 
. X = (AB) 'BA + A 
0 0 1 1.0 
E=|0 1 0 27. E = 0.1 0 
1 0 0 -=1 0 
1.00 i 
3 0 
E=|0 1 2 3. | 
0 1 
0 0 1 
o 1 1 0 0 1 0 0 
k el 35.10. 1 3 31 [0 Ye 0 
0 0 1 0 0 1 


ce 9 


(a) Si A es invertible, entonces BA = CA = (BA)A™' = 
(CAJA * = B(AA *) =C(AA 7!) = BI = CI = 
B=C. 

Sugerencia: reescriba A? — 2A + I = O como 

A(QI— A) =1 

Si AB es invertible, entonces existe una matriz X tal que 

(AB)X = I. Pero entonces A(BX) = I también, de modo 

que A es invertible (con inverso BX). 


a E a a 1) E +1) 
w 5 ala +1)  1/(a° +1) 
53. No es invertible 
1/a 0 0 
55. | -1/44 1/a 0 lazo 
l/a? —1/a? 1/a 
=i -=2 5 —4 
57. 4 I =2 2 
5 Ll .=2 2 
9 2 =4 2 
1 0 0 0 
59 H i i E d+0 
0 0 1 0o p 
—a/d —b/d —c/d 1/d 
4 6 4 
61. No es invertible 63.|5 3 2 
0.6 5 
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1 5. Subespacio 7. No es subespacio 
0 11. b está en col(4), w no está en renglón(A). 
0 15. No 
0 17.([1 0 —1],[0 1 2]) esuna base para renglón(A); 
1| [0 : 
(i, LI} es una base par col(A); =2 es una 
base para nulo(A). A 
19.{[1 0 1 0], [0 1 —1 0], [0 0 O 1]}esuna 
1 1 1 
base para renglón(4);3 10 |,| 1 |, 1 es una 
0 1 1 
=1 
base para col(A); : es una base para nulo(A). 
0 
21.([1 0 —1],[1 1 1])esuna base para renglón(A); 
l Al H ) es una base para col(A) 
| , 23.{[1 1 0 1)[0 1 -1 1),[0 1 -1 —1]pes 
E 1] fo] fo 
oo i ' la i Pe aa v12] una base para renglón(A); A Ñ y 10 es una 
1 1) 0 ¿y 1/6 1/6 
base para col(A) 
0.0 1|/0 1 0 
19.10 1 0 f 0 j 25. Tanto {[1 0 =1], [0 1 2]} como ([1 0 =1], 
[1 1 1]}son conjuntos generadores linealmente in- 
1 0 OJLO O 1 
o1 0o0jfo 0 0 1||0 0 1 0 dependientes para renglón(A) = {[a b —a + 2b]}. 
al 0.0.0 1.0.0 f 10 0 Tanto (| 9] como IN 0 son 
0.0 1 0||0 0 1 0|[1 0 00 1PL1 op L1 
0.0.0 1JL1 0 0 OJLO O O 1 conjuntos generadores linealmente independientes para 
0O 1 0 1 0 0-2 1 col(A) = R. 
mios 0 1 ol 01 ] 11 f- 
o 0 1]L-1 5 0 0 -—16 27.211), 0 
0 1:0 0 1 0 0 0 =] 11.2 0 1 
al o 0 ollo 10 0 -111 3 29.([1 0 0],[o 1 0],[0o 0 1) 
0 0 0O 1[|0 0 1 0 0 0 1 1 31. {[2 —=3 1ļ}[1 -1 0ļ}[4 -4 11 
0.0 1 OJLO -1 0 1 0.0.0 4 35. rank(A) = 2, nulidad(A) = 1 
4 im or = 37. rank(A) = 3, nulidad(A) = 1 
27.| —1 al A 0 lo a 39. Si A es de 3X5 entonces rank(A) = 3, de modo que no 
3 puede haber más de tres columnas linealmente indepen- 
dientes. 


PROSA 41. nulidad(A) = 2,3,40 5 
1. Subespacio 3. Subespacio 


43. Sia = —1, entonces rank(A) = 1; si a = 2, entonces 
rank(A) = 2; para a 4 —1,2, rank(A) = 3. 
45. Sí 47. Sí 49. No 


51. w está en gen(B) si y sólo si el sistema lineal con matriz 
aumentada [B | w] es consistente, lo que es verdadero en 
este caso, pues 


1 11 1 0| 3 
[B]w]=|2 oJje|—>|0 1|-2 
0 -1|2 0 of 0 
A partir de esta forma escalonada reducida por renglón, 
3 


también es claro que [w]y = _al' 
53. rank(A) = 2, nulidad(A) = 1 
55. rank(A) = 3, nulidad(A) = 1 


57. Sean A,,..., A,, los vectores renglón de A, de modo que 
renglón (A) = gen(A,,...,A,,). Si x está en nulo(A), 
entonces, dado que Ax = 0, también se tiene A;* x = 0 
para i = 1...,m, por la definición renglón- 
columna de multiplicación matricial. Si r está en 
renglón(A), entonces r es de la forma r = cA; ++ + 


Cr AA yy, Por tanto, 
rex = (GA; +0 +C,A,,):x 
= q(A x) +: +cp(A,, x) =0 

59. (a) Si un conjunto de columnas de AB es linealmente in- 
dependiente, entonces las correspondientes columnas 
de B son linealmente independientes (por un argu- 
mento similar al necesario para probar el ejercicio 29 
de la sección 3.1). Se tiene que el máximo número 
k de columnas linealmente independientes de AB 
[esto es, k = rank(AB)] no es más que el máximo 
número r de columnas linealmente independientes 
de B [esto es, r = rank(B)]. En otras palabras, 
rank(AB) = rank(B). 

61. (a) Del ejercicio 59(a), rank(UA)< rank(A) y rank(A) = 
rank((U 'U)A) = rank(U (UA))= rank(UA). Por 
tanto, rank(UA) = rank(4). 


Ejercicios 3.6 
0 8 

1. T(u) = , T(v) = 

(a) kH v H 

[fi 1 1 -1 1l 
A CI 

LE =l 2 L 3 

g Skr Y 2 0 
s[i] mp2 Y 

g 0 1 0 3 

[k o] Po ; 
19. i estira o contrae en la dirección x (combinado 


1 0 
con una reflexión en el eje ysi k < 0); f J 


21. 
25. 
31. [ 


33. [ 
35. 


37. 


45. 
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estira o contrae en la dirección y (combinado con una 


0 1 
reflexión en el eje xsi k < 0); | | es una reflexión 


1 


en la recta y = x; | J es un corte en la dirección x; 


1 
| k | es un corte en la dirección y. Por ejemplo, 


y 
y A 


(0, 1) (k,1) (k+1,1) 


(0, 0) 


(0, 1) 


Xx 
(0, 0) (1,0) 
[3/2 A 23.| 1 El 
| -1/2 v3/2 da 
ò =1 = 5 
| H] 
-Z1 0 5 5 
A =0 5 
sem TES 
j 4 1 
s= fi 6 =s] 
- L =2 2 
1 05 =] 
[SoT]=|-1 1 0 
0 =l 1 
| -v3/2 r a -1/2 
1/2 V3/2 ` 1/2 =v3/2 
En forma vectorial, sean las rectas paralelas dadas por 


x= p + id y x' = p' + td. Sus imágenes son T(x) = 
T(p + td) = T(p) + tT(d) y T(x') = T(p' + td) = 
T(p') + tT(d). Suponga que T(d) + O. Si 

T(p') — T(p) es paralela a T(d), entonces las imágenes 
representan la misma recta; de otro modo, las imá- 
genes representan distintas rectas paralelas. Por otra 
parte, si T(d) = 0, entonces las imágenes representan 
dos puntos distintos si T(p') + T(p) y un punto indi- 
vidual de otra manera. 
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47. y 13. Las entradas del vector jP son justo las sumas de 
(22, 3) A (2,3) columna de la matriz P. De modo que P es estocástica si 
: 3 y sólo sijP = j. 
15. 4 17. 9.375 
1 
19. Sí,x = k 21. No 
>x 10 
23. No 25. Sí, x= | 27 
33 
27. Productiva 29. No productiva 
10 
(=2, =3) Q, -3) 10 
| | 33. Sí, x=| 6 
49. y 16 
A 8 
) 500 720 1175 


3 6 
G 5 37.x, = | 70 |; x, = | 350 |, x, = | 504 
50 35 175 
l 50 40 
> X 39. (a) Para L se tiene x, = X% = š 
8 40 
el Bosa e] pi 
X, = Ae, PS , = , == > 
j 32%” liso 7 [1281 [640 
6 
) 


eE 3200 2560 12800 
5’ X; = 512 > Xg = X9 = > 


2560 2048 


51. y 
A pa 
X = A 
10240 
(b) La primera población oscila entre dos estados, 
mientras que la segunda tiende a un estado esta- 
di cionario. 
41. La población oscila a lo largo de un ciclo de tres estados 
(para la población relativa): si 0.1 < s S 1, la población 
real crece; si s = 0.1, la población real pasa por un ciclo 
de longitud 3; y si 0 S s < 0.1, la población real declina 
Ejercicios 3.7 (y a la larga morirá). 
0101 O 1 1 1 1 
1010 1 0 1 0 0 
i p K Bo 8B.A=| o1 pp] &45=|1 1010 
. X] = > X = . (0) 
0.6 0.62 1010 1 0 1 0 1 
150 155 1 0 0O 1 0 
5.x, = | 120 |; x, = | 120 7.18 47. v 49. 
120 115 
as e al ads 
(a) 0.338 0.750 al 


(c) 42.5% húmedo, 57.5% seco 
0.08 0.09 0.11 
11.(a) P = | 0.07 0.11 0.05 
0.85 0.80 0.84 


(b) 0.08, 0.1062, 0.1057, 0.1057, 0.1057 
(c) 10.6% bueno, 5.5% adecuado, 83.9% pobre 


E 


= 
5 

= 
(PS) 


h k 
= N 
= 
EN 
= 
ul 
= 
t 
= 
N 
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0110 0 1010 73. (AA), cuenta el número de vértices adyacentes a ambos 
értices, el i y el j. 
0000 1 0 0 1 0 ve ye] l l 
51. A = o 1 o 1| 554=|1 100 0 75. Bipartita 77. Bipartita 
1.000 1 0 0 0 1 79. Un solo error podría cambiar el vector código c, = [0, 
100.00 1,0, 1] en c' = [1, 1,0, 1]. Sin embargo, c' también po- 
dría obtenerse del vector código c, = [1, 1, 1, 1] vía un 
55. Mr => solo error, de modo que el error no puede corregirse. 
1 1 
1 1 
0 1 
81.| 0 83.| 1 
$ a i i 
1 1 
57. v5 : , 
1 
85. Pc' = | 0 | es la segunda columna de P, de modo que 
1 


el error está en el segundo componente de c'. Por tanto, el 
vector de mensaje correcto (de los primeros cuatro 


v4 1 
. 0 
componentes del vector corregido) es x = 


v 0 
0 
59, 2 61. 3 63. 0 65.3 
67. (a) El vértice ¡ no es adyacente a algún otro vértice. Sao IL EA TA 
69. Si sólo se usan victorias directas, P, está en primer lugar; 1 00000 
P,, P, y P¿ empatan en segundo lugar; y P, y P¿ empatan 010000 
en tercer lugar. Si se combinan victorias directas e indi- 001000 
rectas, los jugadores se clasifican del modo siguiente: P, (b)G=|0 00100 
en primer lugar, seguido por Po Pp P,, P; y P,. 000010 
71:10) 000001 
Ann 0 0 1 0 1I 111111 
0 0 1 1 0 
Bert A=l0 0 0 0 1 (c) Las columnas de P no son distintas. 
Ehaz O oO o0|poppopjojp]1 1 1 1 
9.1000 Soloa al oaa a 
OINO T O T EOT 
Dana Carla propone pii pii Pli 
(b) dos pasos; todas las entradas fuera de la diagonal del OO EE E al AO E 
segundo renglón de A + A? son distintas de cero. oJ C13 L11 LOJ L14 LOJ LOJ LI 
(d) Si la gráfica tiene n vértices, compruebe que la en- 
trada (1, j) de las potencias Ar parak=1l,..., 1 0010 
n — 1. Fl vértice i está conectado al vértice j me- (b) P=|1 1 0 0 1 0f; noes un código de 
diante una trayectoria de longitud k si y sólo si 11 100 


k o 
(4%) + 0. corrección de error. 
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91. Un conjunto de candidatos para P y G es 


1 1 1 1 1 O 10 1 1? 111000 
p= 1 O 1 1 0O 1 10 10 10100 
0O 1 01000 10 110010 
0 000 1 1 11111000 1 
y 
[1 000000000 0 
0 11000000000 
0 0 1 00000000 
00010000000 
00001000000 
00000100000 
0 0 000010000 
G=|0 0 0 00001000 
0 0 000000100 
0o 0 0 000000 10 
0 0 0 0 0 0 0 0 00 I 
1 1 1 1 1 O 1 O I1 I 1I 
1 O 1 1 O 1 1 O I 0 1I 
0 1 O0 1 0 0 O 1I O I 1I 
[0.0.0 0 1 1 1 1 1 1 1 
Preguntas de repaso 
1. (a) V (c) F (e) V (g) V G) V 
17 1 
3. Imposible 5 E z] 
83 166 
0 -9 
pp 
3 9 10 25 
1 =6 


11. Porque (I — A)(I + A + A°) =I- A’ =I- O=], 
Q-A =I+A+ A. 


13. Una base para renglón(A) es {[1, —2, 0,—1, 0], 
[0, 0, 1, 2, 0], [0, 0, 0, 0, 1]}; una base para col(A) es 


2 5 5 
11/21|1 (o la base estándar para R>; y una 
4 3 6 
2 1 
1 0 
base para nulo(A) es $ | 0 b | 72 
0 1 
0 0 


15. Una matriz invertible tiene un espacio nulo trivial 
(cero). Si A es invertible, entonces también lo es A”, y en 


consecuencia tanto A como A” tienen espacios nulos 
triviales. Si A no es invertible, entonces A y A” no nece- 
sitan tener el mismo espacio nulo. Por ejemplo, con- 
sidere 


1 d 
A= a 
E 
17. Puesto que A tiene n columnas linealmente indepen- 
dientes, rank(A) = n. Por tanto, rank(A"A) = n por el 
Teorema 3.28. Puesto que AA es de nXn, esto implica 


que AA es invertible, por el teorema fundamental de 
las matrices invertibles. AA” no necesita ser invertible. 


1 
Por ejemplo, considere A = P. 


i —1/5V2 ear 
"Ll 2/52  6/5v2 
Capítulo 4 


Ejercicios 4.1 


3 
1. Av = 3] = 7, =3 


=) 
av= | |= 3v, = —3 
6 
6 
5. Av = 3 3v, =3 
3 
1 
2 4 
E 
1 1 =j 


11m 100 A 
e(l) 

sason = em |) Ja s = s(a) 

masae = e |) Jr =2.8.= sL) 


1 0 
v= [iha = uv= [fhas 
0 1 


apar Fiaa: 


macon- |,])a=38=e0(|)) 


| 


44 2x 


3y 


1 
27.14=1+15E,,¡= sen( | [a= l= iE 
i 


(L) 


1 
29.4 = 1 +iEp = sen( i] )a= I= E= 


ea([]) 


31. à = 1,2 33.1=4 
Ejercicios 4.2 
1.16 3.0 5. —18 7.6 
9-12  11.ab+ab? 13.4 15. abdg 
17.0 25.2 27.24 29.0 
31.0 33. —24 35. 8 37. —4 
39. —8 45.k +0,2 47.6 49. —3 
51. (-2)3" 


53. det(AB) = (det A) (det B) = (det B) (det A) = det(BA) 


55. 0,1 57.x = ł,y = —} 


1 1 
59.x=-=—1,y=0,z=1 s. |; J 
i i 2 2 
2 73 Dl 
a i =i 
0 0 1 
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Ejercicios 4.3 
1. (a) X — 7A +12 (b)à=3,4 


o m= se [3| )ie = 00) 


(d) Las multiplicidades algebraica y geométrica son 


todas 1. 
3. (a) ~A + 24? + 5A- 6 
(b) à = -2,1,3 
1 
(c) E = gen| | -3| |; E, =gen| |0| |; 
0 0 
E, = gen 2 
10 
(d) Las multiplicidades algebraica y geométrica son 
todas 1. 
5. (a) 4% + X? (b)à=0,1 
2 
(c) E, = gen| | —1 | |;£, = gen] | 0 
1 


(d) à = 0 tiene multiplicidad algebraica 2 y multiplici- 
dad geométrica 1; A = 1 tiene multiplicidades alge- 
braica y geométrica 1. 


7. (a) — A? + 9X? — 274 + 27 


(b) A = 3 
=] 0 
(c) E = gen 0j, |1 
1 0 


(d) à = 3 tiene multiplicidad algebraica 3 y multiplici- 
dad geométrica 2. 


9. (a) Af — 6A? + 9X? + 4A — 12 
(b) à = -1,2,3 
0 1 
(c) E_, = gen 5 ; E, = gen Es ; 
=2 0 
1 0 
0 
Ml 0 
E, = gen 2 
1 


(d) à = —1 yà = 3 tienen multiplicidades algebraica y 
geométrica 1; A = 2 tiene multiplicidad algebraica 2 
y multiplicidad geométrica 1. 
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11. (a) At — 414 + 2X +41 3 


(b) à = -1,1,3 
0 
0 
(c) E, = gen 0 ; 
1 
=2 =2 
E 0 2 
= gen > 5 
1 5 ge 1 0 
3 3 
0 
0 
E, = gen 2 
1 


(d) à = —1 y à = 3 tienen multiplicidades algebraica y 
geométrica 1; À = 1 tiene multiplicidades algebraica 
y geométrica 2. 


2 


| 17. | (2-37 = 17/3” 
2 


3 a 
[<A 


2 
23. (a) à = —2, E, = sen | Jia =5,E,= 


ea( (il) 


2 
(b) (i) à = => Ea = sen | Jia = 5Ēij = 


(E) 


= 


-3 4 -12 

27. 1.0 0 |, =A? — 31M + 4A — 12 
0 1 0 

35. A?= 4A — 51,4? = 11A — 201I 


At = 24A — 55I 
4 11 


a a aL 
37. A A+ZLA 
5 5 


Ejercicios 4.4 


1. El polinomio característico de A es A? — 5À + 1, pero el 
de Bes X? — 224 + 1. 


3. Los eigenvalores de A son À = 2 y À = 4, pero los de B 
sonà =1yà=4. 


uee E i) 


1 
3 
7. À = 6, Es = gen| | 2 
3 


¡54 = -2,E,= 
0 1 
gen 1j, 0 
Sl =l 
9. No es diagonalizable 
1 I =] 2 0 0 
11.P=|[1 1 1|D=|0 —1 0 
1 *=2 0 0 0 1 
13. No es diagonalizable 
1.0.0 =] 2 0 0 0 
15. P = 0 1 0 0 D= 0 2 0 0 
0 0 1 0 0 0 -2 0 
0 0 0 1 0 0 0 =2 
17| 35839 —69630 
—11605 24234 
CNS a 
(3 = (=1))/4 (3! + E 


1 0 0 
21.|0 1 0 
0 0 1 


23. 
| (5 +24 (—3)*)/10 (2 
( 


(=3)")/5 
Qt + 4(=3))/5 


(2 — (-3)0/5 
27.k=0 


2 — 2(—3)9)/5 
25 +24? 4 (-3)')/10 


(2! — 2(=3)*)/5 


(5+ 2? + ( T 
(5 +2 + (—3)*)/10 


25.k=0 


29. Todos los valores reales de k 


35. If A ~ B, entonces existe una matriz invertible P tal que 
B = P'AP. Por tanto, se tiene 


tr(B) = tr(PAP) = tr(P(AP)) = tr((AP)P"!) 
= tr(APP`') = tr(AI) = tr(4) 


al usar el ejercicio 45 de la sección 3.2. 


sef 2 


Respuestas a ejercicios impares seleccionados 


I <=1 0 1 
a 3. (a) | |z 
39. P= —3 -3 1 0.618 
== 00 (b) A, = (3 + V5)/2 = 2.618 


a 


49. (b) dimE_, = 1,dimE, = 2,dimE, = 3 


5. (a) m; = 11.001, y; 


| —0.333 
1.000 
Ejercicios 4.5 1 


1 7. (a) m = 10.000, y, = | 0 
1. (a) , 6.000 i 1 
2.5 


(b) A, =6 
9. k 0 1 2 3 4 5 
H (e ka Ea Eo [esse] 
Xk 1 8 5.923 6.004 6.000 6.000 
lia les leal ll de 
Yk 1 0.308 0.335 0.333 0.333 0.333 
m, 1 26 17.692 18.018 17.999 18.000 
1 
Por tanto, M = 18,v; = | | 
0.333 
11. k 0 1 2 3 4 5 6 
| 1 | 7] [sta 7.755 [750] d al 
Xk 0 2 2.857 3.132 3.212 3.234 3.240 
al la a al leal 
Y 0 0.286 0.377 0.404 0.411 0.413 0.414 
m, 1 7 7.571 7.755 7.808 7.823 7.827 
1 
Por tanto, A, = 7.827, v, = | | 
0.414 
13. k 0 1 2 3 4 5 
1 21 16.809 17.011 16.999 17.000 
Xx, 1 15 12.238 12.371 12.363 12.363 
1 13 10.714 10.824 10.818 10.818 
1 1 1 1 1 1 
Yi 1 0.714 0.728 0.727 0.727 0.727 
1 0.619 0.637 0.636 0.636 0.636 
my 1 21 16.809 17.011 16.999 17.000 


1 
Por tanto, A; = 17, v, = | 0.727 |. 
0.636 
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15. à = 5, =] 0 
0.333 
17. k 0 1 2 3 4 5 6 
x A 7] pa o A p d 
i 0 2 2.857 3.132 3.212 3.234 3.240 
R(x;) 7 7.755 7.823 7.828 7.828 7.828 7.828 
n iad bon) hoil Ba) Baol Bad 
k 
0 0.286 0.377 0.404 0.411 0.413 0.414 
19. k 0 1 2 3 4 5 
1 21 16.809 17.011 16.999 17.000 
Xy 1 15 12.238 12.371 12.363 12.363 
1 13 10.714 10.824 10.818 10.818 
R(x) 16.333 16.998 17.000 17.000 17.000 17.000 
1 1 1 1 1 1 
Ye 1 0.714 0.728 0.727 0.727 0.727 
1 0.619 0.637 0.636 0.636 0.636 
21. k 0 1 2 3 4 5 6 7 8 
| E [sl P PA Pa l a Pa 
Xy 1 4 3.2 2.667 2.286 2.000 1.778 1.600 1.455 
lla lad ll kal ll d al ll 
Y 1 0.8 0.667 0.571 0.500 0.444 0.400 0.364 0.333 
my 1 5 4.8 4.667 4.571 4.500 4.444 4.400 4.364 
1 
Puesto que A, = À, = 4, v, = 2) m, converge 
lentamente en la respuesta exacta. 
23. k 0 1 2 3 4 5 6 7 8 
1 5 4.2 4.048 4.012 4.003 4.001 4.000 4.000 
Xy 1 4 3.2 3.048 3.012 3.003 3.001 3.000 3.000 
1 1 0.2 0.048 0.012 0.003 0.001 0.000 0.000 
1 1 1 1 1 1 1 1 1 
Yk 1 0.8 0.762 0.753 0.751 0.750 0.750 0.750 0.750 
1 0.2 0.048 0.012 0.003 0.001 0 0 0 
m, 1 5 4.2 4.048 4.012 4.003 4.001 4.000 4.000 


25. 


27. 


1 0 
En este caso, A, = A, = 4 y E, = gen| [0 |,| 1 
oj LO 
Claramente, m, converge en 4 y y, converge en un vector en el 
1 0 
eigenespacio E,, a saber, | 0 | + 0.75| 1 |. 
0 0 
k 0 1 2 3 4 


Respuestas a ejercicios impares seleccionados 


m, 1 1 -1 1 -1 


Los eigenvalores exactos son complejos (i y —1), de modo 
que el método de potencias posiblemente no pueda 
convergir en el eigenvalor dominante o en el eigenvector 
dominante si comienza con una iteración inicial real. En 
vez de ello, el método de potencia oscila entre dos 
conjuntos de vectores reales. 


k 0 1 2 3 4 5 

1 3 2.500 2.250 2.125 2.063 
Xy 1 4 4.000 4.000 4.000 4.000 

1 3 2.500 2.250 2.125 2.063 

1 0.750 0.625 0.562 0.531 0.516 
Yi 1 1 1 1 1 1 

1 0.750 0.625 0.562 0.531 0.516 
my 1 4 4 4 4 4 
Los eigenvalores son A, = —12, A, = 4, A, = 2, con 
eigenvectores correspondientes 

1 1 1 
v = 0|v=|2|,v3=J|0]. 

=1 1 1 


Puesto que x} = 3v, + 4v; el vector inicial x, tiene un 
componente cero en la dirección del eigenvector 
dominante, de modo que el método de potencia no puede 
convergir en el eigenvalor/eigenvector dominante. En vez de 
ello, converge en un segundo par eigenvalor/eigenvector, 
como muestran los cálculos. 
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29. Aplique el método de potenciaa A — 18I = k 0 


1 2 3 
4 12 
5 =15] 1 4 =18 18 
Xk 1 2 9 9 
k 0 1 2 3 1 —4 18 18 
1 1 1 1 
S A | : | A | a Ye 1 =05 —0.5 —0.5 
1 10 19 19 1 -1 -1 -1 
1 0.8 0.8 0.8 my 1 4 -18 18 
Yk 1 1 1 1 R(x;) 0.667 —18 —18 18 
m; 1 10 19 19 


En este caso, no existe eigenvalor dominante. (Podría 
elegir 18 o —18 para mp k = 2.) Sin embargo, el 
método de cociente de Rayleigh (ejercicios 17-20) con- 


Por ende, —19 es el eigenvalor dominante de A — 181, y 
A, = —19 + 18 = —1 es el segundo eigenvalor de A. 


31. Aplique el método de potencia a A — 17I = verge en —18. Por ende, —18 es el eigenvalor dominante 
-8 4 8 de A — 171yA, = —18 + 17 = —1 es el segundo 
4 = =å.. eigenvalor de A. 
8 =4 -8 
33. k 0 1 2 3 4 5 
| ' | d | E | i | mea | epa 
x 
k 1 —0.5 1.056 —0.997 —1.000 — 1.000 
K | | rl LA Ea Ba 
7k 1 -1 1 1 1 1 
Mi 1 0.5 1.056 0.997 — 1.000 —1.000 


Por tanto, el eigenvalor de A que es más pequeño en magnitud es 


1/(=1) =-1. 
35. k 0 1 2 3 4 5 

1 —0.500 0.500 0.500 0.500 0.500 

Xk 1 0.000 0.333 0.111 0.259 0.160 

=] 0.500 — 0.500 —0.500 — 0.500 —0.500 

1 —1.000 — 1.000 — 1.000 — 1.000 — 1.000 

Yk 1 0.000 —0.667 —0.222 0.518 0.321 

=l 1.000 1.000 1.000 1.000 1.000 
Mi 1 —0.500 —0.500 —0.500 —0.500 —0.500 


Claramente, m, converge en —0.5, de modo que el eigenvalor 
más pequeño de A es 1/(—0.5) = —2. 
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37. Los cálculos son los mismos que los del ejercicio 33. Ejercicios 4.6 
39. Aplique el método de potencia inverso a A — 5I = 1. No es regular 3. Regular 
=] 0 6 1 11 
=1 -2 1 |. Al tomar xp = | 1 |, se tiene 5. No es regular 7.L= | ; 
6 0 =] 1 
0.304 0.304 0.304 
k 0 1 2 3 9. L = | 0.354 0.354 0,354 
0.342 0.342 0.342 
1 0.200 0.080 0.032 16 
x |i —0.500 —0.500 —0.500 11.1, A 13.2, | 4 
1 0.200 0.080 0.032 i i 
1 —0.400 0.160 —0.064 15. La población aumenta, disminuye y es constante, respec- 
Yz 1 1 1 1 tivamente. 
1 0.400 0.160 0.064 17, Pb, bas] bss +0 by 15152 Sp2 DpSi52 "Sp: 
mo 1 —0.500 —0.500 0.500 AN a A 
a 0. 1 0 0 0 
PIRS]; o i i ' 
Claramente, m, converge en —0.5, de modo que el eigen- 0 0 
valor de A más cercano a 5 es 5 + 1/(—0.5) = 5-2 = 3. L 1 0 
41. 0.732 43. —0.619 El polinomio característico de L es (A” — b,A* — 
47. Im bas A”? bass A"? ==... p SS e EA, 
t 0.660 
al 19.1 = 1.746, p = | 0.264 
L 0.076 
ORN as 
0.147 
—2 al 
T 0.094 
21.1 = 1.092, p = | 0.078 
49 0.064 
i m 0.053 
10+ 0.029 
3 
25. (a) h = 0.082 29. 3, | A 
> Re j 
=1 0 1 
2 
31.3,| 4 33. Reducible 
=) + z 
; ; ] , 35. Irreductible 43. 1,2,4,8, 16 
51. Sugerencia: demuestre que 0 no está contenido en algún a i 
disco de Gerschgorin y luego aplique el Teorema 4.16. 45. 0,1,1,0, —1 47. x, = 4" — (—1) 
= — lin 
53. El ejercicio 52 implica que |À| es menor o igual a todas 49. y, = (n — 3)2 
las sumas de columna de A para todo eigenvalor A. Pero, 51.b, = 1 [a + v3) — (1 - v3)"] 
para una matriz estocástica, todas las sumas de columna 2V3 


son 1. Por tanto |À| 5 1. 
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57. (a) d, = 1, d, = 2, d; = 3, d, = 5, d; = 8 
(b) d, = dari + d„-2 


P 1 (E =] 
(c) no V5 2 3 


59. La solución general es x(t) = —3C,e * + Ce“, y(t) = 


2C,e™ + C,e*'. La solución específica es x(t) = 
—3e™ + 3e“, y(t) = 2e™ + 3e". 
61. La solución pnl es x(t) = (1 + V2)Ce™! + 
(1 = V2) e™™ x(t) = Cie“ + Ce™™”. La solu- 
ción específica es x(t) = (2 + V2)e?'/4 + 
(2 = V2Je 4, x(t) = V2e 9/4 — V2e V"/4, 
63. La solución general es x(t) = —C, + Ge’, y(t) = 
Ci + Get — Cse *,z(t) = Ci + Ce. La solución es- 
pecífica es x(t) =2 — e“, y(t) = -2 + e + e”, 
z(t) = -2 + e. 

65. (a) x(t) = —120e%P + 520e", y(t) = 240e%/5 + 
260'1/1. La cepa X muere después de aproxi- 
madamente 2.93 días; la cepa Y sigue creciendo. 

67.a = 10, b = 20; x(t) = 10e'(cost + sen t) + 10, 

y(t) = 10e'(cost — sen t) + 20. La especie Y muere 
cuando t = 1.22. 


71. x(t) = Cie” + Qe” 


no] ors 
> ome 


81. (a) h | | dl A d | a (c) Punto de silla 
1 0.5 1.75 


83. (a) Jl Alles! eta] (c) Atractor 
0.36 || 0.216 


85.1 = V2,0 = 45°, repelente espiral 
87. r = 2,0 = —60°, repelente espiral 


= =] 0.2- =0.1 . 
89. P = C= , atractor espiral 
1 0 0.1 0.2 


ED 1 das E EA 
1 o P vea y Í 


centro orbital 


Preguntas de repaso 
1. (a) F (c) F (e) F (g) V (i) F 
3. —18 


5. Puesto que A? = —A, se tiene det A = det(A") = 
det(—A) = (—1)" det A = —det A por el Teorema 4.7 y 
el hecho de que n es impar. Se tiene que det A = 0. 


5 
7. Ax M 5% A= 5 
10 


9. (a) 4 — 3X? — 2? 


1 2 1 
(c) E, = gen| | 1 | |E,=gen| | —1 |,| O 
0 0 1 
11. led 13. No es similar 15. No es similar 
17.0, 1,0 1 


19. Si Ax = Ax, entonces (4? — 5A + 2I)x = 
Ax — 5Ax + 2x = 3%x — 5(3x) + 2x = —4x. 


Capítulo 5 
Ejercicios 5.1 
1. Ortogonal 3. No es ortogonal 5. Ortogonal 


0 
1 
7. [w]s = | l 9. [w] =] 5 11. Ortonormal 


umi wI 


1/3 2/V5 2/3V5 
13. | 2/3 |, | -1/V5|,| 4/3v5 
2/3 0 —5/3V5 


15. Ortonormal 


17. Ortogonal, | E a 
cos O sen 0 cos? 0 sen 0 
19. Ortogonal, | —cos 0 sen 0 0 
—sen?0 —cosðsenð cosð 
21. No es ortogonal 
(Qx) : (Qy) 
7er QY) = TOxjay] 
_ (Qx)*Qy 
V(Qx)"Qx V (Qy) Qy 
x"Q'Qy 
VAR Vy" Qy 
x'y X'y 


© VxxVyy  Ixllyl 


= cos(4(x, y)) 


29. Rotación, 0 = 45° 31. Reflexión, y = V3x 
33. (a) A(A" + BD)B = AA'B + AB'B = IB + AI = 
B+AS=SA+B 
(b) Del inciso (a), 


det(A + B) 


det(A(A? + B*)B) 

= det A det(A” + B*)det B 
= det A det((A + B))det B 
= det A det(A + B)det B 


Suponga que det A + det B = 0 (de modo que 

det B = —det A) pero que A + B es invertible. 
Entonces det(A + B) # 0, de modo que 1 = det A 
det B = det A(—det A) = — (det A}. Esto es im- 
posible, así que se concluye que A + B no puede ser 
invertible. 


Ejercicios 5.2 


m 
neij 
E A) 


1 
7. renglón(A):f[1 0 1],[0 1 -armoa [| 


1 


1 
5 2 
9. col(A): 5 , nulo(A?): 
0 1 
— —1 
1 —5 
0 1 
2 PVP 1-7 
1 0 
—4 —3 
: 1 0 
11. < | —10 13 : 
0 1 
—4 
3 0 
al 
3 2 
2 
1s. [;]| 17.| 5 
2 3 


jmi 
s 
< 
II 
m~a 
d alto 
Ll 
+ 
HA 
l 
uie ulg 
il 
N 
p< 
< 
II 
| 
NIN N NIN 
+ 
O Nie 
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25. No 

Ejercicios 5.3 

a ara vahe Lil 
"Mo pl arte lyve yv 


1 2 0 1/V3 
3. y, = =f VV = 1 V3 5 =] ;q = =1/V3 > 
| 1 1 1 -1/73 


L1/V6 1/V2 
e 313 
zii | 4 7.4 = z+] -#2 
oJ L 2 3 3 
0 1 Z 
zii TE bl 3 
NL dls 
Mil bl 
5] L-7 3 
1/V2 1/73 1/V6 
13. Q = 0 1/13  -2/V6 
e 1/73 1/V6 
0 2/V6  1/V3|[v2 1/72 1/v2 
15.|1/V2 -1/V6  1/vV3|| 0 3/V6 1/V6 
1/ V2 1/VY6 -1/v3]L 0 O 2/73 
3 9 } 
17.R=|0 6 3 
0 0 å% 
19.A = AI 
MA? = (QR) = R'Q! = R'Q" = 
1/ V2 -1/V6 -1/2V3 0 1/V2 1/72 
| 0 2/W6 -1/2V3 || 2/V6 -—1/V6  1/V6 
0 0 3/2V31L1/VW3  1/V3 -1/vV3 


23. Sea Rx = 0. Entonces Ax = QRx = Q0 = 0. Puesto 
que Ax representa una combinación lineal de las colum- 
nas de A (que son linealmente independientes), debe 
tener x = 0. Por tanto, R es invertible, por el teorema 


fundamental. 
Ejercicios 5.4 
_[1/v2 ~ sl >] 
La=[ wap?” 0 3 
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3. 


5. 


7. 


11 


13. 


15. 


5 5 3 3 
mas 
R 2 2 2 
5 0 0 0 0 0 
19A=|0 0 O0|+]|0 2 2 
0.000 0 2 2 
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g= E Os 7 o] 


ana —2/V6 0 -1 
0 5 0 0 
o- yv? 1/42 | D=|0 4 0 
1/ V2 1/72 0.0 = 
-1/V2 0 1/v2 2 0 0 
hy 0 LD=|0 1 0 
Jv 0 1/72 00 0 
1/ V2 0 1/ V2 0 
T 0  -1/V2 0 
1/ V2 0 1/V2 | 
1/2 0 -1/V2 
2.000 
02.000 
0000 
0000 
m ha A a b 
E lo El s|: 
as F a+b 0 ]_ 
1V2 -1/V2 -| 0 e 
(a) Si A y B son diagonalizables ortogonalmente, en- 


tonces cada una es simétrica, por el teorema espectral. 
Por tanto, A + B es simétrica, por el ejercicio 35 de la 
sección 3.2, y por tanto es diagonalizable ortogonal- 
mente, por el teorema espectral. 


Si A y B son diagonalizables ortogonalmente, entonces 
cada una es simétrica, por el teorema espectral. Puesto 
que AB = BA, AB también es simétrica, por el ejercicio 
36 de la sección 3.2. Por tanto, AB es diagonalizable or- 
togonalmente, por el teorema espectral. 


| 


Wi WIN Liu 
+ 
v= vu vn m 
ooo 
l 
Rh =. O 
| 
= h O 


| 


wio w= w= 


11. 


13. 


1 0 0 
f 010 f 
G' = E , C' es equivalente a C, pero C' + C 
00 0 
P'=[|1 0 1], C' es equivalente a C, pero C' + C 
1 1100 
P=|0 0 0 1 0f,C es equivalente a C, pero 
010061 
C'ŁC 
o] fo] fı] fı 
c+ =3|0|,|0|,|oÍ|,|o 
oj Lı] Loj Li 
0 0 1 1 
ph 0 0 0 0 
opjļı plo piai 
0 0 0 0 
1 0 
galli Pl 1 
NN 1 1 0 1 
1 1 
1 0 
gajo l pa 0 >] 
¡MEA 1 1 0 1 
E i 
1 0 0 
010 
1101000 
Ma 1010100 
G+=|1 1 0|P*= 
0110010 
i ® i 
1 110001 
0 1 1 
lia 
.2x? + 6xy + 4y? 25. 123 
A 
=5 29 
3 2 
R 33 1 -1 2 
á -2 2 2 
0 Ps a] TET 
Uva =a T 
2/ V5  2/3V35 -1/3 
Q=| 0 5/3V5 2/3 |, 9y? + 97 — 9y3 
1/ V5 =4/3V5. 2/3 


1/43 1/42  1/v6 
39.Q=|-1/V3 0 2/V6 |, 2(x') + 
-1/V3 1/V2 -1/v6 

UY -(2y 


41. Definida positiva 43. Definida negativa 


45. Definida positiva 47. Indefinida 


51. Para cualquier vector x, se tiene x "Ax = x"B"Bx = 
(Bx)"(Bx) = ||Bx||? = 0. Six"Ax = 0, entonces | Bx]? = 0, 
de modo que Bx = 0. Puesto que B es invertible, esto 
implica que x = 0. Por tanto x"Ax > 0 para todo 
x + 0, y en consecuencia A = B'B es definida positiva. 


53. (a) Todo eigenvalor de cA es de la forma cA para algún 
eigenvalor À de A. Por el Teorema 5.24, A > 0, de 
modo que cA > 0, puesto que c es positivo. En con- 
secuencia, cA es definida positiva, por el Teorema 
5.24. 

(c) Sea x + 0. Entonces x"Ax > 0 yx"Bx > 0, puesto 
que A y B son definidas positivas. Pero entonces 
x (A + B)x = x"Ax + x"Bx > 0, de modo que A + 
B es definida positiva. 


l val áximo d dox = -| e 
55. El valor máximo de f(x) es 2 cuando x = + -1/2 
] val ínimo d dox = + P 
el valor mínimo de f(x) es 0 cuando x = + 1 V2!' 
1/V3 
57. El valor máximo de f(x) es 4 cuando x = + 1/V3 |; 
1/V3 
el valor mínimo de f(x) es 1 cuando x = 
1/V2 =1/V2 
+ 0 lo+| 1/v21. 
=1 2 0 
61. Elipse 63. Parábola 65. Hipérbola 


67. Circunferenciax' = x — 2, y' = y — 2, (x) + (y = 4 


È 


y y 
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69. Hipérbola,x” = x, y! = y + 3,(x)/4— (y )Y/9 


, 


Y, y 


75. Hipérbola, (x')? — (y)? = 1 


>» 
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77. Elipse, (x")?/50 + (y”)?/10 = 1 
79. Hipérbola, (x")? — (y" Y = 
81. Degenerada (dos rectas) 


>= 


83. Degenerada (un punto) 
y 


85. Degenerada (dos rectas) 
y 


89. Hiperboloide de una hoja, (x”)? — (y')? + 3(2')? = 1 
91. Paraboloide hiperbólico, z = —(x")? + (yy? 

93. Paraboloide hiperbólico, x” = — V3(y)? + V3(z y? 
95. Elipsoide, 3(x”)? + (y" Y + 2(2"Y = 4 


Preguntas de repaso 
1. (a) V (c) V (e) F (g) F (i) F 
9/2 
3. 2/3 
—11/6 


5. Verifique que QQ = I. 


7. El Teorema 5.6(c) muestra que si v; + v; = 0, entonces 
Qv; : Qv; = 0. El Teorema 5.6(b) muestra que 
[Qv,, ..., Qv;) consiste de vectores unitarios, igual que 
{Vi ... > vi) - Por tanto, {Qv}, ... ,Qv;) es un conjunto 
ortonormal. 


a i 


1 Il 
al 2 
col(A 
1 
3 =5 
=2 =3 —4 
0 =2 =] 
nulo(A): 1] 0} 0 
0 1 0 
0 0 1 


=] 
E 
E 
o 
O 
> 
ss 
A PA 
o a 
Io 
O =. w% Yu 
| 
=. O N =e 


We 
1 1 1 
15. (a) A 
1 1 3 
1] | 0 
"TAS 
1 1 1 
17. 3 A a 
oP|-1 l 
0 oj |-1 
2. 30 
Ml —3 0 
0 0 1 
Capítulo 6 


Ejercicios 6.1 
1. Espacio vectorial 
3. No es un espacio vectorial; falla el axioma 1. 
5. No es un espacio vectorial; falla el axioma 8. 
7. Espacio vectorial 9. Espacio vectorial 


11. Espacio vectorial 15. Espacio vectorial complejo 


17. No es un espacio vectorial complejo; falla el axioma 6. 


19. No es un espacio vectorial; fallan los axiomas 1, 4 y 6. 
2 


= 


. No es un espacio vectorial; las operaciones de suma y 
multiplicación ni siquiera son las mismas. 


25. Subespacio 27. No es un subespacio 
29. No es un subespacio 31. Subespacio 
33. Subespacio 35. Subespacio 
37. No es un subespacio 39. Subespacio 
4 


45. No es un subespacio 


— 


. Subespacio 43. No es un subespacio 


47. Tome U como el eje x y W como el eje y, por ejemplo. 


1] fol 1 
Entonces P y i están en U U W, pero i|- 


+ no lo está. 
0 1 


51. No 

53. Sí; s(x) = (3 + 2t)p(x) + (1 + t)q(x) + tr(x) para 
cualquier escalar t. 

55. Sí; h(x) = f(x) + g(x) 

57. No 

59. No 

61. Sí 


Ejercicios 6.2 


1. Linealmente independiente 


=]. 0 = 1 
3. Linealmente dependiente; | i | = 4 | + 


$ a 0 4 
=2 
1.1 =3 1 
5. Linealmente independiente 
7. Linealmente dependentiente; 3x + 2x* = 7x — 2 
(2x = xX) 
9. Linealmente independiente 
11. Linealmente dependiente; 1 = sen? x + cos? x 
13. Linealmente dependiente; ln(x) = 
—2ln 2.1 + 2-ln(2x) 


17. (a) Linealmente independiente 
(b) Linealmente dependiente 


19. Base 21. No es una base 
23. No es una base 25. No es una base 
=] 
27. [A]ls= | _; 29. [p(x)]s = | =1 
3 


4 
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35. dim V = 2, B = {1 - x, 1 — x% 


manva- (la He Je D 
senva di JED 


41. (n? — n)/2 
43. (a) dim(U Xx V) = dim U + dim V 
(b) Demuestre que si {w}, -.. , W„} es una base para W, 
entonces [(w,, w,), ..., (W, w,)) es una base 
para A. 


45.(1+x1+x+,1) 
1 o] [fo 1] [o —1]| [1 0 
llo dl E o! bl al p ol 
49. {1,1 + x} 
ill == 
53. [sen” x, cos” x} 
59. (a) p(x) = ix? — 3x + 3, p(x) = =x? + 4x — 3, 
px) =3x? -3x + 1 
61. (c) (i) 3x? — 16x + 19 (1 =A F5 


63. (p" =o =e = 0 (p" =p") 


4 


N 


Ejercicios 6.3 
i 2 5 r i 
1. [x]; = 2) [x]: = il reco E Ea z 
A 2 2 2 
1 1 
= 
1 1 1 0 0 
3 x]g = ofise- =] Peg =f 1 0 , 
=l =] 0 =I 1 
1 0 0 
Pgec 1 1 0 
1.1 
spol = | iho | Gp Pes= oo 
eel 
Bol 3 
1 1 1 0 0 
7. [ple = | -1 h= lole- 1 0l, 
1 1 1. 1 1 
1 0 0 
Pgec = 1 1 0 
0 —1 1 
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4 > 
5 0 
9. [A]; = 0 [Ak = 3 Poca 
Sj 3 
3 0 -1 — i2 ii 
0 0 1.0 2110 
Prec 
-1 1 1 1 0100 
5 =i 2 -1 0 1 1 
2 2 1 0 
11 = > TS Pe = > 
O zhes e] 


1 0 
Paee=]_ | 


1 1 
e aya) a 
o 
se- (l 
17=2= 8x = I} 358% = 17 
19. —1 + 3(x + 1) — 3(x + 1} + (x + 1) 


Ejercicios 6.4 
1. Transformación lineal 
5. Transformación lineal 
7. No es una transformación lineal 
9. Transformación lineal 

11. No es una transformación lineal 

13. Se tiene 


Síp(x) + q(x)) = S(p + q)(x)) = x( + 4)(x)) 
= x(p(x) + q(x)) = xp(x) + xq(x) 
= S(p(x)) + S(4(x)) 
y S(cp(x)) = Kep)(=)) = x((cp)(x)) 
= x(cp(x)) = cxp(x) = cS(p(x)) 


Por tanto, S es lineal. De igual modo, 


aE 
= (a + c) + ((a + c) + (b + d)) 
= (a + (a + bx) + (c + (c + d) 


-A(G xla) 


3. Transformación lineal 


y ela) = ca = (ka) + (ka + kb)x 


A) 


Por tanto, T es lineal. 


15. 177 =5-— 14x — 8x?, rs] = ( ES 2) = 
9 b 4 
(=>) (=) 5 
xt xX 
4 3 


17. T(4 — x + 3x°) = 4 + 3x + 5x°, T(a + bx + cx?) = 


3a = BEEN 
a + cx + — x 


19. Sugerencia: sea a = T(E,,),b = T(E,,), c = T(E) d = 
T(E): 

23. Sugerencia: considere el efecto de T y D sobre la base es- 
tándar para P.. 


seli Jea] 2.) 
(To S) H no tiene sentido. 


27. (So Did) 


alos r|) =s s(L a) 


PER > hl 


—3x + 4y) 


eii) (en) 
(4x + y) = (3x + y) 7 


| —3(4x + y) + 4(3x + y) y 


Por tanto, S° T = I y To S = I, de modo que S y T son 
inversos. 


Ejercicios 6.5 
1. (a) Sólo (ii) está en ker(T). 
(b) Sólo (iii) está en el rango(T). 


(©) ker(T) = fle o lþ rangon) = lle el) 


3. (a) Sólo (111) está en ker(T). 
(b) Todos ellos están en dominio(T). 
(c) ker(T) = la + bx+cx:a=-—cb=-=cj= 
{t+ tx — tx?) rango(T) = 


p 


N 


0 1 0 0 
Una base para ker(T) es ffo N i oI} y una base 


para dominio (T) es | D n T}; ranker) = 


0 0 


nulidad (T) = 2, y rank(T) + nulidad (T) = 4 = 
dim M}. 


Una base para ker(T) es {1 + x — x°} y una base para 


dominio(T') es f R H J rank(r) = 2, nulidad) = 1, 


yrank(T) + nulidad (T) = 3 = dim P,. 


9. rank(T) = nulidad(T) = 2 
11. rank(T) = nulidad(T) = 2 
13. rank(T) = 1, nulidad(T) = 2 
15. Inyectiva y sobreyectiva 
17. Ni inyectiva ni sobreyectiva 
19. Inyectiva mas no sobreyectiva 
a 0 0 a 
21. Isomórfica, T 0 b 0|=|b 
0.0 c Cc 
23. No es isomórfica 
25. Isomórfica, T(a + bi) = H 
31. Sugerencia: defina T : € [0, 1] —> € [0, 2] al hacer T(f) la 
función cuyo valor en x es (T(f))(x) = f(x/2) para x en 
[0, 2]. 
33. (a) Sean v; y vz que están en V y sea (S ° T(v,) = 
(So T)(v,). Entonces S(T(v,)) = S(T(v>,) ), por 
tanto T(v,) = T(v,), puesto que S es inyectiva. Pero 
ahora v, = v, pues T es inyectiva. En consecuencia, 
S ° T es inyectiva. 
35. (a) Por el teorema del rank, rank(T) + nulidad(T) = 
dim V. Si T es sobreyectiva, entonces rango(T) 
= W, de modo que rank(T) = dim(rank(T)) = 
dim W. Por tanto, dim V + nulidad(T) < dim W + 
nulidad(T) = rank(T) + nulidad(T) = dim V de 
modo que nulidad(T) < 0, lo cual es imposible. Por 
tanto, T no puede ser sobreyectiva. 
Ejercicios 6.6 
0 1 
L. [T]eeg = [le Al [Tlecgl4 t 2x] 


Respuestas a ejercicios impares seleccionados 


1 0 0 
3. [T]eeg o 1 0l, [Tleesa + bx + c°]g = 
0 0 1 
1 0 Ojja a 
: 1 o ON [a + bx +2) + 
0 0 lle E 
c(x + 2))]e [Ma + bx + cx°)] 
5. [Tleos = ; i i! [Tleegla + bx + cx’]g = 


a+b-1+c-1 
6 4 i 
7: [Thk-g= | =3 -2 ¿Meco 4 = 
B 
2 -1 
6 4 j 0 7 f 
-3 -2 l 0 7 7 
2 -1 7 Ple 7 
E] 
711 
10.0 0 
9. [Ts =|] o pp Uleslals= 
00 0 1 
1 0 0 0 a a 
6-0 1 oļjlbf elo 
o1 oole] lal 
0 0 0 1 d d 
a c 
Li AI 
0-1 1 0 
11 [Thes = ( A o E , [TlecglAlg = 
0O 1 =1 0 
0 —1 1 0 a c=b 
1. 0 0 ılk d-a| 
1 0 0 aille) |a-da| 
0 i =1 0 d b-c 


l: a SH [AB — BAJe =[T(A)le 
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13. (b) [D], = 9 3] 


(c) [D]g[3 sen x — 5 cos x]g = E 


= [3 cosx + 5 sen x]y = 


[D(3 sen x — 5 cos x) ] y 


2 00 
15. (a) [D] =|0 2 1 
0 =1 2 
-1 -2 
mser 2 


19. Invertible, T7*(a + bx) = —b + ax 
21. Invertible, T '(p(x)) = p(x — 2) 
23. Invertible, T (a + bx + cx?) = (a — b + 2c) + 
(b — 2c)x + cx? o T (p(x)) = p(x) — p'(x) + p"(x) 
25. No es invertible 27. =3 sen x = cosx +C 


4 3 
29. $e™ cosx — že™ sen x + C 


EE RETEN 


35. C = {1, x} 
[at - (d? + d3) 
a | 2dd,/(dí + d3) 


en 


3 


= 


2dıd,/(di + d;) 
(a; — dî)/(di + d3) 


Ejercicios 6.7 
1. y(t) = 2e/e? 
3. y(t) = ((1 — )e* + (è — 1)e)/(e? — e*) 


A AE (S e (1+V5)/2 — gll- v52] 
7. y(t) = e — (1 — e Mte' 

9. y(t) = ((k + 1)e" +(k— 1)e™)/2k 

11. y(1) = e*cos(2r) 


13. (a) p(t) = 1008-0918 = 10092 
(b) 45 minutos (c) En 9.968 horas 


15. (a) m(t) = 50e“, donde c = In2/1590 = 4.36 X 107%; 
después de 1000 años quedan 32.33 mg 
(b) Después de 3691.9 años 


5 — 10 cos(10 VK) 
ao VE) sen(VKt) + 10 cos(VKt) 


23. No es lineal 
27. Lineal 


17. x(t) = 


19. (b) No 
25. No es lineal 


29. Lineal 
0 1 1 1 
0 ll 1 1 
31. ] , , 
1 1 0 1 
1 1 0 1 
[olol Joao FFAA PARRA A A 
olbolololililalatolololo lalalala 
oloi olioli olbollolol1la 
olbol1ilalililolololol1al1iltollolala 
35. R, = 
olilol1alol1ilol1alilolalolilolola 
olilol1alilol1lolo olililolola 
olililolol1ilalolilolol1lollilola 
Lola fia folla o Lo] aola aolo] aio] i 
37.[1 1 1 1] 


Preguntas de repaso 

1. (a) F (c) V (e) F (g) F (i) V 

3. Subespacio 

7. Sea A + c,B = O. Entonces cA — c,B = cA" + cB" 

= (c,A + c,B)" = O. Al sumar, se tiene 2c,A = O, de 

modo que c, = 0 puesto que A es distinto de cero. Por 
tanto c,B = O, y en consecuencia c, = 0. Por ende, 
(A, B} es linealmente independiente. 

9. {1, x’, x*}, dim W = 3 


11. Transformación lineal 


5. Subespacio 


13. Transformación lineal 15.n° — 1 
10 =] 
0 1 =2 
17 
0 0 1 
10 -—1 


19. So T esla transformación cero. 
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Ejercicios 7.1 


1. (a) 0 (b) VII (c) V77 


2 
3. Cualquier múltiplo escalar distinto de cero de v = K 


5. (a) —1 (b) V14 (c) V26 
7.1 — 2x? 
9. (a) 7 (b) Vr (c) Vr 


a 


0 
3. Falla el axioma (4): u = H + 0, pero (u, u) = 0. 


= 


0 
5. Falla el axioma (4): u = H + 0, pero (u, u) = 0. 


17. Falla el axioma (4): p(x) = 1 — x no es el polinomio 
cero, pero (p(x), p(x)) = 0. 


4 1 
waei Y 
l1 4 
21. y 
A 
2 
x 
=2 2 
=2 
25 =8 27. V6 
29. |u + v — w|? = (u + v—w,u + vw) 


= (u, u) + (v, v) + (w, w) 
+ 2u, v) — Zu, w) — 2(v, w) 
=1+3+4+2-10-0=0 


Por tanto, |u + v — w|| = 0, de modo que, por el 
axioma (4), u+v=w=00u + v=w. 

31. (u + v,u — v) = (u, u) — (u, v) + (v, u) — (v, v) = 
lul? = (v) + (u, v) = [v]? = ul? — Ivl? 

33. Al usar el ejercicio 32 y una identidad similar para 
|u — vlļ|’, se tiene 


lu + vi? + |u — v|? = (u +v, u + v) +u- v, u — v) 
= ul? +2, 0) + [l 
+ Ju? = 2w) + lvl 
= 2u|? + 2 v] 


Al dividir por 2 produce la identidad que se quiere. 


35. |u + v| = lu — v| > Ju + vl? = |u — vl? 
S ul? + Lu, v) + vl? 

= ul? -= Au, v) + [v]? 

<> Au, v) = —2lu, v) => (u, 


37. i ol 39. {1, x, x°} 
41. (a) 1/V2, V3x/V2,V5(3x? — 1)/2V2 
(b) V7(5x” — 3x)/2 V2 


Ejercicios 7.2 
1. [ull = V42, Jul, = 10, alln = 
3. du, v) = V70, d,(u, v) = 14, eN v)=6 


5. lula = 4, [vila = 5 


v=0 


7. 


9. 


11. 


13. 
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(a) Como máximo un componente de v es distinto de 
Cero. 


= |v]. Entonces ||v||; = 

Vv? tee t vp 4 + v = Vag = |v) = [vli 
Suponga l|v[|,,, = |v,]. Entonces |v;| = |v,] para 
¡=1,...,n, de modo que 


Suponga |v], 


lvli = vı] Toep [va] = [val ÉS 
nlv,] = alv], 


+ [v] 


2 
2 
2 


Q0 u = 


27. 


31. 


33. 


41. 


43. 


45. 


49. 


-Alle = 
-Alle = 
+ [Al], = 2V11 Alı = 


V19, Alh = 4, All = 6 
V31, lAl = 6, lAl = 6 
7 Allo, = 7 


. cond;(A) = anda ) = 21; bien condicionada 
. cond;(A) = cond,(A) = 400; mal condicionada 
. cond,¡(4) = 77, cond,(A) = 128; moderadamente 


mal condicionada 


(a) cond,(A) = 


(máx(|k] + 1, 2)) + 
lle 5130) 
“rsd [Pd 
(a) cond,(A) = 40 


k= 1 
(b) Como máximo 400% de cambio relativo 
ANA] = 


Al usar el ejercicio 33(a) se tiene cond(A) = 
[447] = 11] = 1. 


k=6 51.k=10 
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Ejercicios 7.3 2 —i]f5 
15.A4A=|} ¿1 71[1] 
1. [el = V2 = 1.414 3. le = V6/2 = 1.225 $ ¿JLo 
5. [el = V7 = 2.646 o 0 13 ofaa 
7. y = =3 + 3% |e = 1.225 17.A=|1 0 olfo 2 h el 
9.y =% — 2x, llel| = 0.816 o -1 ojlo O 
11.y = $ + $x, le] = 0.447 
y n a [e = 0 di 2/ V5 0 1/ V5 
13. y = —1 + 2x, jel = 0.632 19.4 =| | | ó 1 b 
15.y=3- 5x +x 17y =5 pX A ISAE 1/ V5 0 =2/V5 
1 4 
AN 5 E 3 1 
Sinai B AT E 2.4= v3, yva yva] + off 
4+t 2 [-1/V2  1/vV2] (Ejercicio 3) 
== $ 11 
23.x = e 25. | 2 0 
i 2 23. (Ejercicio 7) A=3| 1 [o 1]+2| olf 0] 
Pe 0 -1 
27.x = | | 29. y = 0.92 + 0.73x 33. El segmento de recta [—1, 1] 
—2 2 2 
: pa o 
31. (a) Si se hace que el año 1920 corresponda a t = 0, en- 35. La elipse sólida 5 + 4 =1 
tonces y = 56.6 + 2.9t; 79.9 años 
33. (a) p(t) = 15003" 37. (a) |All = V2 (b) cond,(A) = oo 
35. 139 días 39. (a) || All = 1.95 (b) cond,(A) = 38.11 
1 1 1 
1 17 fZ 3 3 3ļ|]2 i 20 
2 2 2 pl > 
37. l 19H 39. 5 3 3)|2 41. 4* = E 0 43.A*=]|0 5 
2 21 L2 1.1 1 2 3 0 1 
3 3 3 S 0 
EL Sl 5 z 
6 3 6 6 i 5 
ES i| satn i s adsl le 
Li s| Z £ 1.04 
D Z aÀ 1 -1 11l 1 1 
47.4% =li i a | | aaf i |z- | 
l 1 1 0 1 6 6 5% 1 
go) 4 
5LAFT=| 3 -1 3 4 ii k oll 1/V2 el 
== g ¿el “Lo -1/V2 1/V2 
53. (a) Si A es invertible, también lo es A”, y se tiene A* = ds | 2 Hl 0 a 
AAA AT = A~. "lu 3jl-1 0 
Ejercicios 7.4 Ejercicios 7.5 
1. 2,3 3. V2,0 5.5 JeRa e )=1 3. g(x) = èx 
Naa ankta? miesa 
mAs f T a o po a 
0- LN NE ISA 11. E 4e — ET e 8 — 6e)x = 0.87 + 1.69x 
0 13 O[|—1 0 
13. A = A ix +3 
$ i all 0 e 13. g(x) = 45 5 


15. 


21. 


23. 


25. 


29. 
35. 


37. 


39. 


g(x) = 39e — 105 + (588 — 216e)x + 
(210e — 570)x* = 1.01 + 0.85x + 0.84x? 


T z( asa) 
— =—| cosx + —— 
T 9 


2 
E 
a = }, ap = 0, b = m 
(=D 
= m,a, = 0, b, = 
Ag T, Ak k Ñ 
d(C) = 1 31. d(C)=2 33. d(C) =3 


d(C) = 3; si C = {c;, € 63, C4}, entonces u se decodifica 
como c,, v no puede decodificarse y w se decodifica 
como c. 


C = {0, 1}, donde 0 es el vector cero y 1 es el vector de 
todos los números 1 en Z$. 


Una matriz de control de paridad P para tal código es 
(8 — 5) X 8 = 3 X 8. Por tanto, rank(P) = 3, de modo 
que cualesquiera cuatro columnas de P deben ser lineal- 
mente dependientes. Por tanto, el entero más pequeño d 
para el cual existen d columnas linealmente dependien- 
tes satisface d = 4. Por el Teorema 7.21, esto significa 
que d(C) = 4, de modo que no existe un código lineal 
(8, 5, 5). 
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Preguntas de repaso 


l. 


3. 


NO 


13. 


17. 


19. 


(a) V  (c)F  (e)V 


5. V3 


(g) V (i 


ONE 


Producto interno 


. No es una norma 11. cond,(A) = 2432 
3 
y =1.7x 15, |5 
3 
(a) V2, V2 
Uva. 1/72 olv2 o0 
a=] 0 0 o v2 f i 
1/ V2 =1/Y42.0 o oJ 1 
1 1 
£ 0 Es 
TETE 
3 0 = 
Los valores singulares de PAQ son las raíces cuadradas 


de los eigenvalores de (PAQ)((PAQ) = Q"ATP"PAQ = 
QATAJQ. Pero Q*(A7A)Q es similar a ATA porque 
Q” = Q*,, y en consecuencia tiene los mismos eigen- 
valores que A”A. Por tanto, PAQ y A tienen los 
mismos valores singulares. 
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de números complejos, 664 
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de vectores, 5, 9, 447 
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ibn Musa, 91 
Algoritmo de la división, 678 
Algoritmo QR, 409-410 
Algoritmo, 91 
Altura de un triángulo, 33 
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Ángulo entre vectores, 24 
Aproximación de Fourier, 638 
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593-594 
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Atractor, 361 
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Axiomas 
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B 
Base ortogonal, 381, 560 
Base ortonormal, 383, 560 
Bases canónicas, 204, 465 
Base, 204, 464 
cambio de, 481-490 
canónica, 204, 465 
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467 
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ortogonal, 381, 560 
ortonormal, 383, 560 
Binet, Jacques, 349 
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€, 453 
C”, 450, 566 
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Cerradura para 
adición, 198, 447 
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447 
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Circuito, 248 
Círculo de taxi, 553 
Círculo unitario, 21 
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Cociente de números complejos, 665, 668 
Cociente de Rayleigh, 327 
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Código(s) 
autodual, 424 
binario, 54 
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de corrección de error, 251-255, 
641 
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de Reed-Muller, 545 
Hamming, 254 
dimensión de, 253 
distancia mínima de, 640 
dual, 422 
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longitud de, 253 
vector de, 54, 252 
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de Fourier, 638 
de un polinomio, 675 
de una combinación lineal, 12, 160 
de una ecuación lineal, 64 
matriz de, 70 
método de indeterminados, 681 
Cofactor, 277 
Combinación lineal, 12, 160, 451 
Complemento de Schur, 294 
Complemento de un vector binario, 
546 
Complemento ortogonal, 389-393 
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ortogonal a un subespacio, 393, 
561 


Composición de transformaciones 
lineales, 225, 495 
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631 
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Cónica, 
degenerada, 432, 442 
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no degenerada, 432 
Conjunto ortogonal de vectores, 380, 560 
Conjunto ortonormal de vectores, 383, 
560 
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disjuntos, 651 
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vacío, 649 
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131, 323-327, 586-589 
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343 
Cuadrado mágico, 478 
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próximo, 641 
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por inducción matemática, 657- 
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y normas matriciales, 623-625 
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y pseudoinversa, 625-626 
y rango, 623 


Descomposición espectral, 416 
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Desigualdad de Cauchy-Schwarz, 22, 
562 
Desigualdad del triángulo, 22, 563, 575 
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geométrica, 571 
Determinante de Vandermonde, 302 
Determinante(s), 171 
aplicaciones geométricas de, 297- 
302 
de matrices elementales, 282 
de matrices de n X n, 276-280 
de Vandermonde, 302 
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expansión de cofactores de, 277- 
280 
propiedades de, 280-282 
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Diagonalización, 314-320 
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Diagrama de Venn, 649 
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de matrices, 146 
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de vectores, 8, 451 
Dígito de control, 55 
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entre vectores, 23, 558 
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640 
Distributividad, 10, 19, 160, 164, 447 
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Dominio, 218, 500 


E 
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Ecuación paramétrica 

de un plano, 39, 41 

de una recta, 36, 41 
Ecuación química balanceada, 107 
Ecuación(es) 

lineal, 64 

normal, 598 

sistema de, lineales, 65 
Ecuación(es) cuadrática(s), graficación, 

432-440 
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322-327 
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Eje z, 8 
Elemento pivote, 71 
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Error cuadrático medio, 635 
Error de mínimos cuadrados, 595 
Error de redondeo, 69 
Escalamiento, 325 
Escalar, 8 
Esfera unitaria, 558 
Espacio con producto interno, 554 
distancia entre vectores en un, 
558 
longitud de vectores en un, 558 
propiedades de un, 558 
vectores ortogonales en un, 558 
y desigualdades de Cauchy- 
Schwarz y del triángulo, 562- 
563 
Espacio 
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dual, 532 
lineal normado, 575 
métrico, 578 
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renglón, 201 
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471 
vectorial de dimensión infinita, 
471 
Espacio(s) vectorial(es), 447 
base para, 464 
complejo, 447, 450, 566-567 
de dimensión finita, 471 
de dimensión infinita, 471 
dimensión de, 471 
isomórfico, 511 
sobre Zp 447, 450 
subespacio de, 452 
Espectro, 414 
Euler, Leonhard, 672 
Expansión de un producto externo, 
153 
Expansión por cofactores, 277-280 
Exponencial de una matriz, 357 


F 
F, 449 
Factorización 
LU, 186-192, 
QR, 403-405 
QR modificada, 407-409 
Factorización matricial, 186. Vea también 
Descomposición de valor singular 
(DVS). 
y diagonalización, LU, 186-192 
P" LU, 193 
QR, 403-405 
QR modificada, 407-409 
y teorema de triangulación de 
Schur, 419 
Factorización QR, 403-405 
mínimos cuadrados y, 605-606 
modificada, 407-409 
Fibonacci, 347 
Forma cuadrática, 425-426 
definida negativa, 430 
definida positiva, 430 
diagonalización de una, 428 
indefinida, 430 
matriz asociada con, 426 
semidefinida negativa, 430 
semidefinida positiva, 430 
Forma de proyección del Teorema 
Espectral, 416 
Forma de punto flotante, 89 
Forma de un producto externo de la 
DVS, 619 


Forma escalonada de una matriz 
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